NER

V prvej fáze rozpoznávania entít vyhľadávame známe entity v texte. Známe entity získavame zo slovníkov a regulárnych výrazov. Následne aplikujeme pravidlá, ktoré pokrývajú špecifiká jazyka a typické chyby pri anotácii pomocou slovníkov. Tieto pravidlá využívajú zistené entity, informácie z predspracovania, kontextové slová, ale aj regulárne výrazy a typické sekvencie slov. V druhej fáze využívame všetky doteraz získané informácie, ako črty pri klasifikácii pomocou netrénovaného štatistického modelu. Výstup sa ešte koriguje pravidlami, ktoré pokrývajú najčastejšie chyby štatistického modelu.

Skúšobný text.