Informace o publikaci

Slovotvorné vztahy v českém WordNetu

Autoři

PALA Karel HLAVÁČKOVÁ Dana

Rok publikování 2007
Druh Konferenční abstrakty
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
Popis V článku popisujeme obohacení českého WordNetu o derivační vztahy tvořící slovotvorná hnízda nebo (v jiné terminologii) sémantické podsítě. Derivační vztahy v češtině jsou natolik pravidelné, že je můžeme přidat do českého WordNetu téměř automaticky. K získání slovotvorných hnízd využíváme derivační verze morfologického analyzátoru Ajka, který v sobě obsahuje formální pravidla popisující základní a produktivní slovotvorné vztahy. Dále pracujeme s nástrojem, derivačním webovým rozhraním, které umožňuje získávat dvojice fundující : fundovaný na velkých souborech dat. To umožňuje poloautomaticky odvozovat potřebné tvary pomocí substantivních derivačních sufixů a slovesných prefixů a na tomto základě pak lze vhodně rozhodovat o sémantické povaze jednotlivých derivací. Zatím jsme zpracovali cca 22 českých substantivních derivačních sufixů a cca 16 slovesných prefixů, dospěli jsme tu k souboru 14 derivačních vztahů, které jsou charakterizovány sémanticky, přičemž použité značkování zachycuje sémantické kategorie vyjadřované jednotlivými derivačními vztahy, i když v některých případech rozdíly mezi nimi spočívají jen v přináležitosti ke slovnímu druhu.
Související projekty: