Title: | Text Line Segmentation in Historical Newspapers |
Other Titles: | Segmentace řádek textu v historických novinách |
Authors: | Lenc, Ladislav Martínek, Jiří Král, Pavel |
Citation: | LENC, L. MARTÍNEK, J. KRÁL, P. Text Line Segmentation in Historical Newspapers. In Artificial Intelligence and Soft Computing. Cham: Springer Nature Switzerland AG, 2022. s. 35-48. ISBN: 978-3-031-23479-8 , ISSN: 0302-9743 |
Issue Date: | 2022 |
Publisher: | Springer Nature Switzerland AG |
Document type: | konferenční příspěvek ConferenceObject |
URI: | 2-s2.0-85149639546 http://hdl.handle.net/11025/54900 |
ISBN: | 978-3-031-23479-8 |
ISSN: | 0302-9743 |
Keywords: | segmentace obrazových dokumentů;analýza rozložení stránky;plně konvoluční neuronové sítě;FCN |
Keywords in different language: | document image segmentation;layout analysis;fully convolutional network;FCN |
Abstract: | Článek řeší problematiku segmentace textových řádek v historických novinách. Je zde navržen nový přístup, který dělí úlohu na dvě části: detekci textových bloků a detekci řádek. Tento přístup by měl odstranit nedostatky metod, které segmentaci řádek provádějí v jednom kroku. Jednotlivé podúlohy jsou řešeny s využitím plně konvolučních neuronových sítí. Metoda je vyhodnocena na dvou standardních datasetech, Europeana a RDCL 2019, a na novém korpusu, který byl vytvořen z dat dostupných na portálu Porta fontium. Tato datová sada je volně přístupná pro výzkumné účely. |
Abstract in different language: | The paper deals with text line segmentation in historical newspapers. We propose a novel approach which decomposes this problem into two steps: text-block and text-line segmentation. The method should solve issues that may appear in a more commonly used one-step approach. The particular tasks are handled using fully convolutional neural networks. The approach is evaluated on two standard corpora, Europeana and RDCL 2019, and on a novel dataset created from data available in Porta fontium portal. This dataset is freely available for research purposes. |
Rights: | Plný text je přístupný v rámci univerzity přihlášeným uživatelům © The Author(s) |
Appears in Collections: | Konferenční příspěvky / Conference papers (NTIS) OBD |
Files in This Item:
File | Size | Format | |
---|---|---|---|
978-3-031-23480-4_3.pdf | 291,32 kB | Adobe PDF | View/Open Request a copy |
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11025/54900
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.