Název: | Text Line Segmentation in Historical Newspapers |
Další názvy: | Segmentace řádek textu v historických novinách |
Autoři: | Lenc, Ladislav Martínek, Jiří Král, Pavel |
Citace zdrojového dokumentu: | LENC, L. MARTÍNEK, J. KRÁL, P. Text Line Segmentation in Historical Newspapers. In Artificial Intelligence and Soft Computing. Cham: Springer Nature Switzerland AG, 2022. s. 35-48. ISBN: 978-3-031-23479-8 , ISSN: 0302-9743 |
Datum vydání: | 2022 |
Nakladatel: | Springer Nature Switzerland AG |
Typ dokumentu: | konferenční příspěvek ConferenceObject |
URI: | 2-s2.0-85149639546 http://hdl.handle.net/11025/54900 |
ISBN: | 978-3-031-23479-8 |
ISSN: | 0302-9743 |
Klíčová slova: | segmentace obrazových dokumentů;analýza rozložení stránky;plně konvoluční neuronové sítě;FCN |
Klíčová slova v dalším jazyce: | document image segmentation;layout analysis;fully convolutional network;FCN |
Abstrakt: | Článek řeší problematiku segmentace textových řádek v historických novinách. Je zde navržen nový přístup, který dělí úlohu na dvě části: detekci textových bloků a detekci řádek. Tento přístup by měl odstranit nedostatky metod, které segmentaci řádek provádějí v jednom kroku. Jednotlivé podúlohy jsou řešeny s využitím plně konvolučních neuronových sítí. Metoda je vyhodnocena na dvou standardních datasetech, Europeana a RDCL 2019, a na novém korpusu, který byl vytvořen z dat dostupných na portálu Porta fontium. Tato datová sada je volně přístupná pro výzkumné účely. |
Abstrakt v dalším jazyce: | The paper deals with text line segmentation in historical newspapers. We propose a novel approach which decomposes this problem into two steps: text-block and text-line segmentation. The method should solve issues that may appear in a more commonly used one-step approach. The particular tasks are handled using fully convolutional neural networks. The approach is evaluated on two standard corpora, Europeana and RDCL 2019, and on a novel dataset created from data available in Porta fontium portal. This dataset is freely available for research purposes. |
Práva: | Plný text je přístupný v rámci univerzity přihlášeným uživatelům © The Author(s) |
Vyskytuje se v kolekcích: | Konferenční příspěvky / Conference papers (NTIS) OBD |
Soubory připojené k záznamu:
Soubor | Velikost | Formát | |
---|---|---|---|
978-3-031-23480-4_3.pdf | 291,32 kB | Adobe PDF | Zobrazit/otevřít Vyžádat kopii |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/54900
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.