Informace o publikaci

Classification of Errors in Text

Název česky Klasifikace chyb v textu
Autoři

JAKUBÍČEK Miloš BUŠTA Jan HLAVÁČKOVÁ Dana PALA Karel

Rok publikování 2009
Druh Článek ve sborníku
Konference RASLAN 2009 : Recent Advances in Slavonic Natural Language Processing
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
www http://nlp.fi.muni.cz/raslan/2009/
Obor Jazykověda
Klíčová slova errors in text; classification of errors
Popis Tento článek prezentuje dvě klasifikace chyb v českých textech. Základním zdrojem je korpus Chyby, který byl vytvořen v letech 1999-2000 ([1]). Tento korpus obsahuje různé druhy chyb jako např. pravopisné, typografické, gramatické, sémantické, lexikální a stylistické. Tyto chyby byly ručně opraveny a vyznačeny podle anotačního schématu pro klasifikaci chyb, která byla pro tento účel vyvinuta. Za účelem anotace byl vyvinut nástroj zvaný WinCorr. V článku je popsáno první anotační schéma i jeho revize navržená za účelem získání přesnějšího popisu chyb, které se v textech vyskytují. Předmětem diskuse jsou zároveň základní principy, na nichž obě anotace staví.
Související projekty: