Title: Text Line Segmentation in Historical Newspapers
Other Titles: Segmentace řádek textu v historických novinách
Authors: Lenc, Ladislav
Martínek, Jiří
Král, Pavel
Citation: LENC, L. MARTÍNEK, J. KRÁL, P. Text Line Segmentation in Historical Newspapers. In Artificial Intelligence and Soft Computing. Cham: Springer Nature Switzerland AG, 2022. s. 35-48. ISBN: 978-3-031-23479-8 , ISSN: 0302-9743
Issue Date: 2022
Publisher: Springer Nature Switzerland AG
Document type: konferenční příspěvek
ConferenceObject
URI: 2-s2.0-85149639546
http://hdl.handle.net/11025/54900
ISBN: 978-3-031-23479-8
ISSN: 0302-9743
Keywords: segmentace obrazových dokumentů;analýza rozložení stránky;plně konvoluční neuronové sítě;FCN
Keywords in different language: document image segmentation;layout analysis;fully convolutional network;FCN
Abstract: Článek řeší problematiku segmentace textových řádek v historických novinách. Je zde navržen nový přístup, který dělí úlohu na dvě části: detekci textových bloků a detekci řádek. Tento přístup by měl odstranit nedostatky metod, které segmentaci řádek provádějí v jednom kroku. Jednotlivé podúlohy jsou řešeny s využitím plně konvolučních neuronových sítí. Metoda je vyhodnocena na dvou standardních datasetech, Europeana a RDCL 2019, a na novém korpusu, který byl vytvořen z dat dostupných na portálu Porta fontium. Tato datová sada je volně přístupná pro výzkumné účely.
Abstract in different language: The paper deals with text line segmentation in historical newspapers. We propose a novel approach which decomposes this problem into two steps: text-block and text-line segmentation. The method should solve issues that may appear in a more commonly used one-step approach. The particular tasks are handled using fully convolutional neural networks. The approach is evaluated on two standard corpora, Europeana and RDCL 2019, and on a novel dataset created from data available in Porta fontium portal. This dataset is freely available for research purposes.
Rights: Plný text je přístupný v rámci univerzity přihlášeným uživatelům
© The Author(s)
Appears in Collections:Konferenční příspěvky / Conference papers (NTIS)
OBD

Files in This Item:
File SizeFormat 
978-3-031-23480-4_3.pdf291,32 kBAdobe PDFView/Open    Request a copy


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/54900

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

search
navigation
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD