Informace o publikaci

Multiword Expressions in Czech (a case study)

Název česky Víceslovné výrazy v češtině (případová studie)
Autoři

PALA Karel ŠMERK Pavel

Rok publikování 2010
Druh Článek ve sborníku
Konference Karlík a továrna na lingvistiku. Prof. Petru Karlíkovi k šedesátým narozeninám
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
Obor Informatika
Klíčová slova Czech Multiword Expressions; Word Sketches; n-grams
Popis V článku se probírá databáze českých víceslovných výrazů nedávno vzniklá v Centru ZPJ FI MU a čítající nyní cca 160 000 jednotek. Byla získána z různých zdrojů - slovníků, veřejnných seznamů vlastních jmen a toponym a korpusů. Řada kolokací byla získána z českého WordNetu a seznamů botanických a zoologických termínů. Pro získávání víceslovných výrazů z korpusů byla použita technika slovních profilů.
Související projekty: