Informace o publikaci

A New Approach for Semi-automatic Building and Extending a Multilingual Terminology Thesaurus

Název česky Nový přístup k poloautomatické tvorbě a rozšiřování vícejazyčného terminologického tezauru
Autoři

RAMBOUSEK Adam HORÁK Aleš BAISA Vít SUCHOMEL Vít

Rok publikování 2019
Druh Článek v odborném periodiku
Časopis / Zdroj International Journal on Artificial Intelligence Tools
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
www
Doi http://dx.doi.org/10.1142/S0218213019500088
Klíčová slova Thesaurus building; terminology dictionary; domain-corpus exploitation; knowledge extraction; term extraction; DEB platform; knowledge-rich contexts
Popis Článek popisuje nový systém pro poloautomatickou tvorbu, rozšiřování a správu terminologického tezauru - vícejazyčného terminologického slovníku obohaceného o vztahy mezi termíny, aby vytvořil tezaurus. Systém umožňuje výrazně zlepšit workflow existujících odborných terminologických skupin, které využívají pro editační rozhodnutí převážně introspekci. Představený systém doplňuje lexikografický proces pomocí technik zpracování přirozeného jazyka, které jsou integrovány do editačního prostředí tezauru. Metodologie systému a výsledný tezaurus jsou úzce spojeny s novým doménovým korpusem v šesti jazycích. Tyto se používají pro příklady použití termínů a také pro automatickou extrakci nových kandidátských termínů. Terminologický tezaurus je přístupný přes webovou aplikaci, která a) prezentuje podrobné obohacené informace o každém termínu, b) vizualizuje vztahy mezi termíny, c) zobrazuje skutečné příklady použití termínu v doménových dokumentech a v kontextu podobných termínů. Navíc jsou specializované korpusy použity pro detekci možných překladů termínu z původního jazyka (čeština) do ostatních jazyků (angličtiny, francouzština, němčina, ruština, slovenština) a také pro detekci nadřazených pojmů. Tento projekt byl realizován pro terminologický tezaurus zeměměřictví, ale nástroje a metodologie jsou využitelné také pro další odborné terminologie.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info