Fast syntactic searching in very large corpora for many languages

Název česky Rychlé syntaktické vyhledávání ve velkých korpusech pro mnoho jazyků
Autoři JAKUBÍČEK Miloš RYCHLÝ Pavel — KILGARRIFF Adam — MCCARTHY Diana
Druh Článek ve sborníku
Citace JAKUBÍČEK, Miloš, Pavel RYCHLÝ, Adam KILGARRIFF a Diana MCCARTHY. Fast syntactic searching in very large corpora for many languages. In PACLIC 24 Proceedings of the 24th Pacific Asia Conference on Language, Information and Computation. Tokyo: Waseda University, 2010. s. 741-747, 7 s. ISBN 978-4-905166-00-9.
Originální jazyk angličtina
Obor Informatika
Klíčová slova corpus search; large corpora; CQL; syntactic search

Prvním krokem pro mnoho lingvistických výzkumů je vyhledání příkladů. V 21. století by tyto příklady měly být vždy vyhledávány, nikoli vymýšleny. Proto potřebují lingvisté flexibilní nástroje pro vyhledávání i okrajových jazykových jevů. Takové vyhledávání musí být navíc rychlé i pro velké korpusy a složité dotazy. Představujeme rozšíření ke korpusovému dotazovacímu jazyku CQL pro intuitivní vytváření syntaktických dotazů a ukážeme, že tyto dotazy mohou být rychle vyhodnocovány našimi nástroji i pro korpusy o velikostech v řádech miliard pozic.

Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info