Informace o projektu
Počítačový korpus českých psaných textů (Počítačový fond češtiny)

Kód projektu

GA405/93/0218

Období řešení

1/1993 - 1/1995

Investor / Programový rámec / typ projektu

Grantová agentura ČR

Standardní projekty

Fakulta / Pracoviště MU

Fakulta informatiky

prof. PhDr. Karel Pala, CSc.

Další fakulta/pracoviště MU

Filozofická fakulta

Spolupracující organizace

Ústav pro jazyk český AV ČR, v. v. i.

Odpovědná osoba PhDr. Věra Schmiedtová

Univerzita Karlova

Odpovědná osoba doc. RNDr. Vladimír Petkevič, CSc.
Odpovědná osoba PhDr. Alla Bémová, CSc.

Cílem projektu je vytvořit reprezentativní korpus českých psaných textů v rozsahu 20 miliónů slovních tvarů a na jeho základě pak v druhé fázi připravit velký Slovník českého jazyka. Výsledky projektu budou k dispozici v následujících podobách: a) souhrnná výzkumná zpráva obsahující informace o korpusu a jeho vytváření, b) vlastní korpus uložený ve standardním formátu na počítačových médiích, c) soubor nástrojů - algoritmů a programů pro práci na korpusu, d) v konečné fázi (nikoli v rámci tohoto grantu) Slovník českého jazyka. Na projektu se budou podílet přední odborníci v současné i historické bohemistice, lexikografii a počítačové lingvistice, kteří pocházejí z univerzitních pracovišť na filozofické fakultě Karlovy a Masarykovy univerzity, dále z pracoviště na Matematicko-fyzikální fakultě UK a také z Ústavu pro jazyk český AV ČR.

Studijní programy

Přijímačky a TSP

Přečtěte si o výzkumu na MU

Informace o projektu
Počítačový korpus českých psaných textů (Počítačový fond češtiny)

Studijní programy

Přijímačky a TSP

Přečtěte si o výzkumu na MU

Informace o projektuPočítačový korpus českých psaných textů (Počítačový fond češtiny)

Informace o projektu
Počítačový korpus českých psaných textů (Počítačový fond češtiny)