Anonymizácia súdnych rozhodnutí

V prvom kroku sa pomocou štatistického modelu a všetkých dostupných vlastností textu extrahovaných v predchádzajúcich krokoch anotujú všetky časti textu, ktoré je potrebné anonymizovať. Následne prebieha korekcia prípadných chýb pomocou pravidiel. V druhom kroku sa na základe definovaných pravidiel, vykoná anonymizácia dokumentu. V našom prípade ide o nahradenie slov veľkým písmenom abecedy nasledované bodkou a čísla sú nahrádzané za písmeno X.

Skúšobný text.