Název: | Historical Map Toponym Extraction for Efficient Information Retrieval |
Další názvy: | Extrakce toponym z historických map pro efektivní vyhledávání informací |
Autoři: | Lenc, Ladislav Martínek, Jiří Baloun, Josef Prantl, Martin Král, Pavel |
Citace zdrojového dokumentu: | LENC, L. MARTÍNEK, J. BALOUN, J. PRANTL, M. KRÁL, P. Historical Map Toponym Extraction for Efficient Information Retrieval. In Document Analysis Systems : 15th IAPR International Workshop on Document Analysis Systems, DAS 2022. Cham: Springer, 2022. s. 171-183. ISBN: 978-3-031-06554-5 , ISSN: 0302-9743 |
Datum vydání: | 2022 |
Nakladatel: | Springer |
Typ dokumentu: | konferenční příspěvek ConferenceObject |
URI: | 2-s2.0-85131115206 http://hdl.handle.net/11025/51648 |
ISBN: | 978-3-031-06554-5 |
ISSN: | 0302-9743 |
Klíčová slova: | historické mapy;toponyma;detekce textu;optické rozpoznávání znaků;vyhledávání informací;plně konvoluční neuronové sítě |
Klíčová slova v dalším jazyce: | Historical maps;Toponyms;Text detection;OCR;IR;FCN |
Abstrakt: | Článek se zabývá detekcí, klasifikací a rozpoznáváním toponym v ručně kreslených historických katastrálních mapách. Toponyma jsou místní jména měst, vesnic a dalších míst, jako jsou řeky, lesy atd. Extrahovaná toponyma se používají jako klíčová slova v systému vyhledávání informací, které umožňuje inteligentní a efektivní vyhledávání v historických mapových sbírkách. Vytvořili jsme novou datovou sadu, která je volně dostupná pro výzkumné účely. Poté navrhujeme nový přístup ke klasifikaci toponym založený na deskriptoru KAZE. Dále porovnáváme a vyhodnocujeme několik nejmodernějších metod pro detekci na naší úloze detekce toponym. Na závěr prezentujeme výsledky rozpoznávání textu toponym pomocí populárního enginu Tesseract. |
Abstrakt v dalším jazyce: | The paper deals with detection, classification and recognition of toponyms in hand-drawn historical cadastral maps. Toponyms are local names of towns, villages and landscape features such as rivers, forests etc. The detected and recognized toponyms are utilized as keywords in an information retrieval system that allows intelligent and efficient searching in historical map collections. We create a novel annotated dataset that is freely available for research and educational purposes. Then, we propose a novel approach for toponym classification based on KAZE descriptor. Next we compare and evaluate several state-of-the-art methods for text and object detection on our toponym detection task. We further show the results of toponym text recognition using popular Tesseract engine. |
Práva: | Plný text je přístupný v rámci univerzity přihlášeným uživatelům © Springer Nature Switzerland AG |
Vyskytuje se v kolekcích: | Konferenční příspěvky / Conference papers (NTIS) Konferenční příspěvky / Conference Papers (KIV) OBD |
Soubory připojené k záznamu:
Soubor | Velikost | Formát | |
---|---|---|---|
DAS_clanek_ve_sborniku.pdf | 2,16 MB | Adobe PDF | Zobrazit/otevřít Vyžádat kopii |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/51648
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.