Project information
Modulární open-source workflow pro analýzu archivních dokumentů
- Project Identification
- 819/2026
- Project Period
- 7/2026 - 6/2027
- Investor / Pogramme / Project type
-
CESNET
- Development Fund of CESNET
- MU Faculty or unit
- Institute of Computer Science
Projekt je zaměřen na vytvoření modulárního workflow pro komplexní digitální analýzu archivních dokumentů. Workflow bude postavené na existujících open-source nástrojích (ownCoud, Zotero, Arkindex, Nodegoat, Logseq a Open WebUI). Hlavním cílem projektu je:
(1) Udržitelné nastavení celého řešení s využitím CESNET služeb (ownCloud, e-INFRA Open WebUI) a standartních otevřených protokolů a formátů (API, WebDAV, XML, CSV).
(2) Napojení vhodného LLM (Large Language Model) hostovaného na e-INFRA Open WebUI do aplikace Arkindex za účelem pokročilého HTR (Handwritten Text Recongnition) a NER (Named Entity Recognition).
(3) Napojení vhodného LLM hostovaného na e-INFRA Open WebUI do aplikace Nodegoat za účelem komplexní analýzy a vizualizace extrahovaných dat.