Informace o publikaci

Reprezentace významu sloves (valence a sémantické role)

Autoři

PALA Karel HLAVÁČKOVÁ Dana

Rok publikování 2010
Druh Článek ve sborníku
Konference Sborník konference Kognice 2010
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
Klíčová slova representation of the verb meanings valency frames VerbaLex semantic roles
Popis V článku věnujeme pozornost valenčním rámcům českých sloves a lexikální databázi VerbaLex čítající 6 360 synsetů, 21 193 literálů, 10 482 lemmat, 19 556 valenčních rámců a 82 sémantických tříd. Databáze vznikala od r. 2005 v Centru zpracování přirozeného jazyka FI MU v Brně. Zmíníme se také o podobných zdrojích jak pro češtinu (Vallex, (Lopatková, Žabokrtský)), tak i pro angličtinu (WordNet, (Fellbaum a VerbNet, Kipper)). Základními jednotkami (hesly) jsou slovesná lemmata organizovaná v synonymických řadách (synsetech) s čísly významů, která mají v českém WordNetu (CzWN). Jednotlivým lemmatům jsou přiřazeny komplexní valenční rámce (KVR) zachycující informaci o morfosyntaktických (pády) a sémantických vlastnostech slovesných argumentů. Sémantické ohodnocení argumentů zachycujeme sémantickými rolemi tvořenými: a) hlavními rolemi založenými na prvcích vybraných z vrcholové ontologie EuroWordNetu (Vossen et al), tj. cca 40 značkami jako SUBS – substance, ENT – entita, PART – part, COM – communication, ACT – action, INS – instrument, GROUP – group aj. b) subkategorizačními rysy majícímí podobu literálů vybraných z Princetonského WordNetu (PWN), jichž je kolem 1000. Literály jsou součástmi uzlů v hypero/hyponymických stromech tvořících posloupnosti sémantických rysů popisujících význam lexikálních jednotek vyskytujících se v konkrétních valenčních rámcích.
Související projekty: