Informace o publikaci

The Art of Mathematics Retrieval

Název česky Umění indexování a vyhledávání matematiky
Autoři

SOJKA Petr LÍŠKA Martin

Druh Článek ve sborníku
Konference Proceedings of the 2011 ACM Symposium on Document Engineering
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
WWW
Doi http://dx.doi.org/10.1145/2034691.2034703
Obor Informatika
Klíčová slova math indexing and retrieval; mathematical digital libraries; information systems; information retrieval; mathematical content search; document ranking of mathematical papers; math text mining; MIaS; WebMIaS
Popis V článku je navržena architektura nového systému, MIaS (Math Indexer and Searcher), a návrh je zdůvodněn. Byl zvolen přístup založený na podobnosti matematických formulí v prezentačním MathML. Systém byl implementován a návrh verifikován na široce používaném indexačním systému Apache Lucene. Škálovatelnost byla ověřena na více než 400,000 odborných matematických článcích z archivu arXiv s 158 miliony matematickými formulemi. To představovalo indexování téměř tří bilionů matematických podformulí v MathML pomocí Solr-kompatibilního rozšíření Lucene.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info