Project information
Computers Corpus of Czech Written Text

Project Identification

GA405/93/0218

Project Period

1/1993 - 1/1995

Investor / Pogramme / Project type

Czech Science Foundation

Standard Projects

MU Faculty or unit

Faculty of Informatics

prof. PhDr. Karel Pala, CSc.

Other MU Faculty/Unit

Faculty of Arts

Cooperating Organization

Institute of the Czech Language of the ASCR, v. v. i.

Responsible person PhDr. Věra Schmiedtová

Charles University

Responsible person doc. RNDr. Vladimír Petkevič, CSc.
Responsible person PhDr. Alla Bémová, CSc.

Cílem projektu je vytvořit reprezentativní korpus českých psaných textů v rozsahu 20 miliónů slovních tvarů a na jeho základě pak v druhé fázi připravit velký Slovník českého jazyka. Výsledky projektu budou k dispozici v následujících podobách: a) souhrnná výzkumná zpráva obsahující informace o korpusu a jeho vytváření, b) vlastní korpus uložený ve standardním formátu na počítačových médiích, c) soubor nástrojů - algoritmů a programů pro práci na korpusu, d) v konečné fázi (nikoli v rámci tohoto grantu) Slovník českého jazyka. Na projektu se budou podílet přední odborníci v současné i historické bohemistice, lexikografii a počítačové lingvistice, kteří pocházejí z univerzitních pracovišť na filozofické fakultě Karlovy a Masarykovy univerzity, dále z pracoviště na Matematicko-fyzikální fakultě UK a také z Ústavu pro jazyk český AV ČR.

10 reasons why you will fall in love with MU

Ask our ambassador

Read about research at MU

Project information
Computers Corpus of Czech Written Text

10 reasons why you will fall in love with MU

Ask our ambassador

Read about research at MU

Project informationComputers Corpus of Czech Written Text

Project information
Computers Corpus of Czech Written Text