====== Státní magisterská zkouška v programu Informatika, obor Umělá inteligence a zpracování přirozeného jazyka N-IN UMI ====== ==== Zaměření: Zpracování přirozeného jazyka ==== - [[mgr-szz:in-uni-nlp:1-nlp|Počítačové zpracování přirozeného jazyka, vztah k AI: Segmentace slova, automatická morfologická analýza a syntéza. Gramatiky jako reprezentace znalostí. Gramatiky v Prologu, DCG. Rozpoznávání a generování větné struktury, základní typy analýzy a analyzátorů. Strojové slovníky a gramatické rysy (příznaky). Reprezentace slovníků v XML, slovníky kmenů, thesaury a slovníky typu WordNet. Sémantická analýza věty, slovesné valence, sémantické role a subkategorizační rysy. Princip kompozicionality (skladebnosti) a sémantické reprezentace vět. Pragmatická rovina, struktura promluvy, textová analýza. Reprezentace znalostí ve vztahu k PJ. Sémantické sítě obecně, rámce, logická reprezentace a logická forma (PK1, TIL). Inference ve vztahu k přirozenému jazyku (monotonní, nemonotonní). Analýza promluvy, konverzační agenti, agenti typu BDI (fungující na základě přesvědčení, modelující vůli a vybavení komunikačními záměry). Zpracování informace, vyhledávání, extrakce informací, otázkové systémy.]] - [[mgr-szz:in-uni-nlp:2-nlp|Textové korpusy a počítačová lexikografie: Korpusy a jejich typy, jejich struktura. Korpusové softwarové nástroje: manažery, statistické, třídicí a konkordanční programy. Značkování (anotování) korpusů - gramatické, syntaktické a sémantické. Značkovací nástroje - statistické a pravidlové značkovače (taggery). Desambiguace. Elektronické slovníky a a lexikální databáze, XML reprezentace. Struktura hesla, popis významu slova - slovníkové definice. Softwarové nástroje pro lexikografy: editory, prohlížeče, lexikografické stanice (platforma DEB II).]] - [[mgr-szz:in-uni-nlp:3-nlp|Strojový překlad: Základní koncepce strojového překladu: binární s transferem a na bázi převodního jazyka. Klíčové otázky strojového překladu: víceznačnost, reprezentace významu vět a znalostí, význam slov a idiomů. Lexikální, morfologická a syntakticko-sémantická analýza. Pravidla pro transfer, syntéza. Struktura slovníků pro SP a valenční slovníky. Některé úspěšné systémy SP. Pokusy o překladové systémy s češtinou. Elektronické překladové slovníky pro češtinu. Systémy SP využívající znalostí, statisticky založené systémy SP.]] - [[mgr-szz:in-uni-nlp:4-nlp|Logická analýza přirozeného jazyka: Problém významu. Syntaktika, sémantika a pragmatika. Frege: význam a smysl. Churchova formulace. Kritika fregeovské sémantiky. Kritika Quineovy behavioristické sémantiky. Teorie možných světů. Montague, Kripke. Funkcionální teorie významu. Princip extenzionality, princip skladebnosti. Transparentní intenzionální logika a teorie typů. Epistémická báze. Extenze a intenze. Pojem konstrukce. Teorie pojmu. Výraz - pojem - objekt. Intenzionální kontexty. Analýza tázacích vět.]] - [[mgr-szz:in-uni-nlp:5-nlp|Počítačové zpracování řeči a dialogové systémy: Vytváření a vnímání řeči, vztah k syntéze a rozpoznávání řeči. Základní metody zpracování akustického signálu v časové a frekvenční oblasti (krátkodobá energie, autokorelační funkce, Fourierova transformace, pásmová filtrace, kepstrum). Syntéza řeči, koartikulace a prozodie (ve vztahu k syntéze). Rozpoznávání řeči (segmentace, Markovovy modely, algoritmus Dynamic Time Warping). Dialogové systémy.]] - [[mgr-szz:in-uni-nlp:6-nlp|Sémantika a komunikace: Sémantika jako disciplina. Pět funkcí přirozeného jazyka. Typy významu, sémantické vztahy a jejich zachycení v podobě sémantických sítí, struktura WordNetu a EuroWordNetu. Ontologie a hierarchické sémantické struktury. Vágnost významu a typy víceznačnosti. Desambiguace významů slov (WSD, pravidlová, statistická). Významy slov (lexikálních jednotek) a jejich formální popis prostřednictvím kontextů a kontextových vzorců, nástroje pro tento typ analýzy (Word Sketch Engine, sémantické shluky). Komponentová analýza a sémantické rysy. Významy vět a jejich formální reprezentace s využitím aparátu TIL. Nástroje pro oblast sémantické analýzy, prohlížeče a editory. Vztahy k sémantickému webu, metadata, inference pro sémantický web.]] - [[mgr-szz:in-uni-nlp:7-nlp|Textové informační systémy: Základní pojmy informačních systémů a jejich klasifikace. Vyhledávací systémy, vyhledávací algoritmy a datové struktury. Vyhledávací metody s předzpracováním vzorků a textů - indexové metody, signaturové metody. Metody indexování, konstrukce thesauru. Jazyky pro vyhledávání. Komprese dat. Statistické metody komprese dat. Slovníkové metody komprese dat. Komprese textů s použitím neuronových sítí. Syntaktické metody. Kontextové modelování. Kontrola správnosti textu, korektory překlepů a gramatické korektory, dělení slov, fulltextové aplikace.]]