Rychlé syntaktické vyhledávání ve velkých korpusech pro mnoho jazyků

Základní údaje

Originální název Fast syntactic searching in very large corpora for many languages
Autoři
Miloš Jakubíček
Pavel Rychlý
Adam Kilgarriff
Diana McCarthy

Další údaje

Citace JAKUBÍČEK, Miloš, Pavel RYCHLÝ, Adam KILGARRIFF a Diana MCCARTHY. Fast syntactic searching in very large corpora for many languages. In PACLIC 24 Proceedings of the 24th Pacific Asia Conference on Language, Information and Computation. Tokyo: Waseda University, 2010. s. 741-747, 7 s. ISBN 978-4-905166-00-9.
Originální název angličtina
Obor Informatika
Druh Článek ve sborníku
Klíčová slova corpus search; large corpora; CQL; syntactic search

Anotace

Prvním krokem pro mnoho lingvistických výzkumů je vyhledání příkladů. V 21. století by tyto příklady měly být vždy vyhledávány, nikoli vymýšleny. Proto potřebují lingvisté flexibilní nástroje pro vyhledávání i okrajových jazykových jevů. Takové vyhledávání musí být navíc rychlé i pro velké korpusy a složité dotazy. Představujeme rozšíření ke korpusovému dotazovacímu jazyku CQL pro intuitivní vytváření syntaktických dotazů a ukážeme, že tyto dotazy mohou být rychle vyhodnocovány našimi nástroji i pro korpusy o velikostech v řádech miliard pozic.

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info