====== AP9, IN9 Konečné automaty ====== ===== Zadání ===== definice, konstrukce konečného automatu, minimalizace konečného automatu, převod nedeterministického konečného automatu na deterministický automat ===== Definice konečného automatu ===== **Konečný automat** //M// je pětice (//Q//, Sigma, delta, //q₀//, //F//), kde * //Q// je neprázdná konečná množina **stavů**, * Sigma je konečná množina **vstupních symbolů** (vstupní abeceda), * delta: //Q x //Sigma //-> Q// je parciální **přechodová funkce** (v případě nedeterministického konečného automatu je definována jako totální zobrazení delta: //Q x //Sigma// -> 2^Q//), * //q₀// in //Q// je **počáteční stav**, * //F// ⊆ //Q// je množina **koncových stavů** === Rozšířená přechodová funkce deterministického konečného automatu: === Abychom mohli definovat jazyk akceptovaný automatem, je třeba zavézt rozšířenou přechodovou funkci hat{delta}: //Q x //Sigma* //-> Q// definována induktivně vzhledem k délce slova ze Sigma*: * hat{delta}(//q//, epsilon) = //q// pro každý stav //q// in //Q// * hat{delta}(//q//, //wa//) = *delta(hat{delta}(//q//, //w//), //a//) je-li hat{delta}(//q//, //w//) i delta(hat{delta}(//q//, //w//), //a//) definováno *ortho jinak Jazyk akceptovaný konečným automatem //M//, označovaný //L//(//M//) je tvořen právě všemi takovými slovy, pod kterými automat přejde z počátečního stavu do některého z koncových. //L//(//M//) = {//w// in Sigma* | hat{delta}(//q₀//,//w//) in //F//} === Rozšířená přechodová funkce nedeterministického konečného automatu: === hat{delta}: //Q x //Sigma* //-> 2^Q//, definována induktivně vzhledem k délce slova ze Sigma*: * hat{delta}(//q//, epsilon) = {q} * hat{delta}(//q//, //wa//) = bigcup{p in hat{delta}(q,w)}{}{delta(p,a)} Jazyk akceptovaný nedeterministickým konečným automatem //M//, označovaný //L//(//M//) je tvořen právě všemi takovými slovy, pod kterými automat přejde z počátečního stavu do některého z koncových. //L//(//M//) = {//w// in Sigma* | hat{delta}(//q₀//,//w//) inter //F// != varnothing} ===== Konstrukce konečného automatu ===== Mějme například jazyk //L// = {//w// in {//a//, //b//}* | //w// obsahuje podslovo //abaa//}. * konstrukce konečného automatu, který rozpoznává daný jazyk, je obecně netriviální úkol. Pro zjednodušení proto volíme označení stavů tak, aby bylo patrné, jaká část podslova //abaa// již byla automatem přečtena. Konečný automat akceptující jazyk //L// je možné reprezentovat: ==== Uspořádanou pěticí ==== M = ({lbrace}q_ε, q_a, q_ab, q_aba, q_abaa{rbrace}, {lbrace}a, b{rbrace}, delta, q_ε, {lbrace}q_abaa{rbrace}) kde přechodová funkce delta vypadá následovně: | delta(q_epsilon, a) = q_a | delta(q_ab, b) = q_epsilon | | delta(q_epsilon, b) = q_epsilon | delta(q_aba, a) = q_abaa | | delta(q_a, a) = q_a | delta(q_aba, b) = q_ab | | delta(q_a, b) = q_ab | delta(q_abaa, a) = q_abaa | | delta(q_ab, a) = q_aba | delta(q_abaa, b) = q_abaa | ==== Tabulkou ==== | | ^ a ^ b ^ | -> ^ q_epsilon | q_a | q_epsilon | | ^ q_a | q_a | q_ab | | ^ q_ab | q_aba | q_epsilon | | ^ q_aba | q_abaa | q_ab | | <- ^ q_abaa | q_abaa | q_abaa | ==== Přechodovým grafem ==== {{home:inf:graf.gif|Přechodový graf}} ==== Výpočetním stromem ==== * není určen jednoznačně. Může se lišit podle toho, jakým způsobem jej konstruujeme. * Příklad výpočetního stromu pro automat //M//: {{:home:inf:vypocetni-strom.gif|Výpočetní strom}} ==== Synchronní paralelní kompozice ==== Pro dané automaty //M₁// a //M₂// umožňuje sestrojit automat rozpoznávající **průnik**, **sjednocení** či **rozdíl** jazyků //L//(//M₁//) a //L//(M₂). Nechť //M₁// = (//Q₁//, Sigma, delta₁, //q₁//, //F₁//), //M₂// = (//Q₂//, Sigma, delta₂, //q₂//, //F₂//) a přechodové funkce delta₁, delta₂ jsou **totální**. Definujeme konečný automat //M₃// = (//Q₃//, Sigma, delta₃, //q₃//, //F₃//), kde * //Q₃// = //Q₁// x //Q₂// = {(//p//,//q//) | //p// in //Q₁//, //q// in //Q₂//} * //F₃// = //F₁// x //F₂// = {(//p//,//q//) | //p// in //F₁//, //q// in //F₂//} * //q₃// = (//q₁//, //q₂//) * delta₃( (//p//,//q//),//a//) = (delta₁(//p//,//a//),delta₂(//q//,//a//) ) Potom //L//(//M₃//) = //L//(//M₁//) inter //L//(//M₂//) Podobně pro sjednocení a rozdíl - zmení sa len množina koncových stavov * //F₃// = (//F₁// x //Q₂//) union (//Q₁// x //F₂//) = {(//p//,//q//) | //p// in //F₁// ∨ //q// in //F₂//} pre zjednotenie * //F₃// = //F₁// - //F₂// = {(//p//,//q//) | //p// in //F₁// ∧ //q// notin //F₂//} pre rozdiel == Příklad průniku == {{:home:inf:kompozice.gif|Synchronní paralelní kompozice}} ==== Automat pro komplement ==== K automatu //M// = (//Q//, Sigma, delta, //q₀//, //F//) s **__totální__ přechodovou funkcí** sestrojíme automat overline{M} rozpoznávající jazyk //co--L//(//M//) jako overline{M} = (//Q//, Sigma, delta, //q₀//, //Q -- F//). //Poznámka//: přechodovou funkci ztotálníme tak, že přidáme nový nekoncový stav ("černá díra"), do kterého "nasměrujeme chybějící šipky". ===== Minimalizace konečného automatu ===== **Minimální konečný automat** = automat s nejmenším počtem stavů, který rozpoznává daný regulární jazyk //L//. Existence minimálního konečného automatu souvisí s Myhill--Nerodovou větou (viz otázka [[home:inf:ap8|AP8,IN8 Regulární jazyky]]), kterou můžeme přeformulovat takto: Počet stavů libovolného minimálního automatu rozpoznávajícího jazyk //L// je roven indexu prefixové ekvivalence //~_L//. (Takový konečný automat existuje právě když index //~_L// je konečný.) Minimální konečný automat akceptující jazyk //L// je určen jednoznačně až na isomorfismus (tj. přejmenování stavů). Minimalizace konečného automatu probíhá tak, že nejprve jsou odstraněny **nedosažitelné** stavy a poté jsou ztotožněny **jazykově ekvivalentní** stavy. ==== Odstranění nedosažitelných stavů ==== Nechť //M// = (//Q//, Sigma, delta, //q₀//, //F//) je konečný automat. Stav //q// in //Q// nazveme **dosažitelný**, pokud existuje //w// in Sigma* takové, že hat{delta}(//q₀//, //w//) = //q//. Stav je **nedosažitelný**, pokud není dosažitelný. === Algoritmus pro eliminaci nedosažitelných stavů konečného automatu === **Vstup**: Konečný automat //M// = (//Q//, Sigma, delta, //q₀//, //F//) **Výstup**: Ekvivalentní automat //M'// bez nedosažitelných stavů. //i// := 0 //S_i// := {//q₀//} **repeat** //S//_//i//+1 := //S_i// union {//q// | exists//p// in //S_i//, //a// in Sigma: delta(//p//, //a//) = //q//} //i// := //i// + 1 **until** //S_i// = //S//_//i//--1 //Q'// := //S_i// //M'// = (//Q'//, Sigma, delta|_//Q'//, //q₀//, //F// inter //Q'//) //Poznámka//: Zápis delta|_//Q'// znamená, že funkce delta je omezena na množinu //Q'//. //Intuitivně//: Množina //S_i// je množina stavů dosažitelná v automatu v maximálně //i// krocích. ==== Ztotožnění jazykově ekvivalentních stavů ==== Nechť //M// = (//Q//, Sigma, delta, //q₀//, //F//) je konečný automat bez nedosažitelných stavů, jehož přechodová funkce je totální. Stavy //p//, //q// nazveme **jazykově ekvivalentní**, psáno //p// ≡ //q//, pokud //p// ≡ //q// doubleleftright forall//w// in Sigma* : (hat{delta}(//p//, //w//) in //F// doubleleftright hat{delta}(//q//, //w//) in //F//). **Reduktem** automatu //M// = (//Q//, Sigma, delta, //q₀//, //F//) nazveme konečný automat //M///_≡ = (//Q///_≡, Sigma, eta, [//q₀//], //F///_≡), kde: * Stavy jsou třídy rozkladu //Q///_≡ (třída obsahující stav //q// je [//q//]). * Přechodová funkce eta je funkce splňující: forall//p//,//q// in //Q//, foralla in Sigma: delta(//q//, //a//) = //p// doubleright eta([//q//], //a//) = [//p//]. * Počáteční stav je třída rozkladu //Q///_≡ obsahující stav //q₀//. * Koncové stavy jsou právě ty třídy rozkladu //Q///_≡, které obsahují alespoň jeden koncový stav. Nechť //M// = (//Q//, Sigma, delta, //q₀//, //F//) je konečný automat bez nedosažitelných stavů s totální přechodovou funkcí. Pak //L//(//M//) = //L//(//M///_≡). Pro každé //i// in bbN₀ definujeme binární relaci ≡_//i// na //Q// předpisem //p// ≡_//i// //q// doubleleftright forall//w// in Sigma*.|//w//| <= //i// : (hat{delta}(//p//, //w//) in //F// doubleleftright hat{delta}(//q//, //w//) in //F//) * //p// ≡_//i// //q// právě když //p// a //q// nelze "rozlišit" žádným slovem délky <= //i// * //p// ≡ //q// právě když //p// ≡_//i// //q// pro každé //i// in bbN₀. (≡ = bigcap{i=0}{infty}{≡}_i) - ≡₀ = {(//p//, //q//) | //p// in //F// doubleleftright //q// in //F//} - ≡_//i//+1 = {(//p//, //q//) | //p// ≡_//i// //q// wedge forall//a// in Sigma : delta(//p//, //a//) ≡_//i// delta(//q//, //a//)} === Algoritmus konstrukce minimálního automatu === **Vstup**: Konečný automat //M// = (//Q//, Sigma, delta, //q₀//, //F//) bez nedosažitelných stavů s totální přechodovou funkcí **Výstup**: Redukt //M///_≡. //i// := 0 ≡₀ := {(//p//, //q//) | //p// in //F// doubleleftright //q// in //F//} **repeat** ≡_//i//+1 := {(//p//, //q//) | //p// ≡_//i// //q// wedge forall//a// in Sigma : delta(//p//, //a//) ≡_//i// delta(//q//, //a//)} //i// := //i// + 1 **until** ≡_//i// = ≡_//i//--1 ≡ = ≡_//i// //M///_≡ := (//Q///_≡, Sigma, eta, [//q₀//], //F///_≡) == Příklad == {{:home:inf:automat_3min.jpg|Konstrukce minimálního automatu}} * První tabulka obsahuje nedostupné stavy (stav 7). * Druhá tabulka ukazuje přechodovou funkci po úpravě na totální, přidáním nového stavu N a nasměrováním všech nedefinovaných přechodů do něj. * Ostatní čtyři tabulky reprezentují postupnou minimalizaci automatu. Na začátku tabulku přechodové funkce rozdělíme do dvou částí(tříd), do druhé části zaznamenáme výstupní stavy, do první části ty ostatní. Obě části označíme římskými číslicemi. Postupně procházíme stavy automatu který chceme minimalizovat, a pro jednotlivé prvky abecedy zjišťujeme, ve které části tabulky se nachází stav do kterého se při přechodu dostaneme. Číslo této části zapíšeme do tabulky k prvku abecedy u zpracovávaného stavu. (**tabulka 3**) \\ Tabulku opět rozdělíme, do částí(tříd) které označíme římskými číslicemi, v každé necháme stavy ze kterých se pod všemi prvky abecedy dostaneme do stejných částí tabulky. Aplikujeme předchozí krok.(**tabulka 4,5**) \\ Tento postup aplikujeme dokud každá část tabulky neobsahuje jen stavy přecházející do stejných tříd. Ve výsledné tabulce nezapisujeme názvy stavů, ale jen označení tříd s jejich přechody(**tabulka 6**). ===== Převod NFA na DFA ===== Pro každý NFA //M// = (//Q//, Sigma, delta, //q₀//, //F//) existuje ekvivalentní DFA. ==== Algoritmus transformace NFA na DFA ==== **Vstup**: NFA //M// = (//Q//, Sigma, delta, //q₀//, //F//). **Výstup**: Ekvivalentní DFA //M'// = (//Q'//, Sigma, delta', {//q₀//}, //F//') bez nedosažitelných stavů a s totální přechodovou funkcí. //Q'// := { {//q₀//} }; delta' := varnothing; //F'// := varnothing; //Done// := varnothing; **while** (//Q'// -- //Done//) <>varnothing **do** //M// := libovolný prvek množiny //Q'// -- //Done// **if** //M// inter //F// <>varnothing **then** //F'// := //F'// union {//M//} **fi** **foreach** //a// in Sigma **do** //N// := bigcup{p in M}{}{delta(p,a)} //Q'// := //Q'// union {//N//} delta' := delta' union {( (//M//, //a//),//N//)} **od** //Done// := //Done// union {//M//} **od** //M'// = (//Q'//, Sigma, delta', {//q₀//}, //F'//) === Příklad === Mějme nedeterministický konečný automat : {{:home:inf:automat_1.jpg|}} | ^ a ^ b ^ ^ -> 1| 1,2 | 1,7 | ^ 2| - | 3 | ^ 3| - | 4 | ^ 4| 5 | - | ^ <- 5| 5 | 5 | ^ 6| - | 5 | ^ 7| 6 | - | \\ Převod nedeterministického automatu na deterministický provedeme pomocí algoritmu následovně: Začínáme vstupním stavem, který napíšeme do tabulky (**1**). Zjistíme množinu stavů, do kterých se dostaneme pomocí prvků abecedy. (**pro //a// 1,2**, **pro //b// 1,7**). Poté vždy vytvoříme (pokud ještě neexistuje) nový stav pojmenovaný jako sjednocení stavů (**pro //a// 12**, **pro //b// 17**) a zaznamenáme do tabulky. Vezmeme poté následující nezpracovaný stav v nově tvořené tabulce (**12**) a zjistíme do jaké množiny stavů se lze dostat ze stavů **1** a **2** a provedeme jejich sjednocení (**pro //a// 1,2** , **pro //b// 1,3,7**) poté opět zaznamenáme případný nový stav. Od této chvíle pokračujeme obdobně. \\ Algoritmus končí, ve chvíli kdy není možné nalézt žádný nový stav. Vstupní stavy zůstávají stejné, koncové stavy jsou ty, které obsahují některý z původních koncových stavů. Takto vytvořený automat nemusí být minimální, ale je bez nedosažitelných stavů, s totální přechodovou funkcí. {{:home:inf:automat_2.jpg|}} | ^ a ^ b ^ ^ -> 1| 12 | 17 | ^ 12| 12 | 137 | ^ 17| 126 | 17 | ^ 137| 126 | 147 | ^ 126| 12 | 1357 | ^ 147| 1256 | 17 | ^ <- 1357| 1256 | 1457 | ^ <- 1256| 125 | 1357 | ^ <- 1457| 1256 | 157 | ^ <- 125| 125 | 1357 | ^ <- 157| 1256 | 157 | ==== Využití ==== Konečné automaty se používají např. k lexikální analýze. ===== Literatura ===== [[http://is.muni.cz/elportal/estud/fi/js06/ib005/Formalni_jazyky_a_automaty_I.pdf|Skripta Automaty a formální jazyky I]] [[http://www.fi.muni.cz/~xstrejc/IB102/slajdy/slajdy_corr.pdf|Slidy k předmětu Automaty a gramatiky]] ===== Vypracoval ===== Lukáš Hala, 173454@mail.muni.cz Pokud si myslíte, že tady něco chybí, přebývá nebo že je něco blbě, tak to prosím upravte ;-) FIXME Je potřeba ještě zapracovat [[http://statnice.dqd.cz/tmp/konecne_automaty.pdf|poznámky od Jitky Pospíšilové]]. ~~DISCUSSION~~