Název: | Segmentace historických obrazových dokumentů |
Další názvy: | Segmentation of historical document images |
Autoři: | Liška, Miroslav |
Vedoucí práce/školitel: | Lenc Ladislav, Ing. Ph.D. |
Oponent: | Král Pavel, Doc. Ing. Ph.D. |
Datum vydání: | 2019 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/37423 |
Klíčová slova: | segmentace;historické dokumenty;konvoluční neuronové sítě |
Klíčová slova v dalším jazyce: | segmentation;historical documents;convolutional neural networks |
Abstrakt: | Správná segmentace obrazových dokumentů je jednou z nejdůležitějších součástí OCR systémů. Během ní jsou v obrázcích automaticky označovány oblasti zájmu, jako jsou například textové bloky, řádky textů, oddělovací čáry a jiné. Historické obrazové dokumenty jsou často různě deformované, obsahují šum a mají nepravidelnou strukturu a tak je úspěšná segmentace těchto dokumentů velkou výzvou. V rámci diplomové práce byly prozkoumány možné přístupy k segmentaci historických dokumentů a po následné analýze byly použity plně konvoluční neuronové sítě ARU-Net, U-Net a její úprava. Dále se práce věnuje tvorbě datové sady, zejména pak vytvoření očekávaných výsledků segmentace a nástrojům pro jejich vytvoření. Na základě dosažených výsledků modelů na této datové sadě je pro označování textu vybrána síť upravený U-Net, pro nalezení oddělovacích čar a pro označení řádků textu síť ARU-Net. Spojením výsledků jednotlivých sítí a jejich následným zpracováním byl vytvořen program, který ve vstupním obrázku detekuje a vyřezává řádky textu a to tak, aby bylo zachováno pořadí čtení. Takto získané řádky jsou vhodné pro další zpracování OCR. |
Abstrakt v dalším jazyce: | Correct segmentation of image documents is one of the most important tasks in OCR. During segmentation, areas of interests such as text blocks, text lines and separators are automatically labeled. Historical image documents are often malformed, contain noise and have irregular structure. Because of these issues, successful segmentation of such documents presents a difficult challenge. This Master's thesis explores possible approaches to segmentation of historical documents, after subsequent analysis, fully convolutional neural networks ARU-Net and U-net and its variations were used for this task. This thesis also deals with manual creation of a data set, particularly with creation of expected results of segmentation and suitable tools for achieving this task. Based on results obtained from models trained on the created data set, variation of the U-net network was selected for text labeling and ARU-net for finding of separators and labeling of lines of text. The result of this thesis a program combining results of individual neural networks. This program is able to detect and cut lines of text from input images while retaining reading order. Text lines obtained from this program are suitable for further OCR processing. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
Liska_Miroslav_2019.pdf | Plný text práce | 56,47 MB | Adobe PDF | Zobrazit/otevřít |
A18N0094Phodnoceni-ved.PDF | Posudek vedoucího práce | 373,24 kB | Adobe PDF | Zobrazit/otevřít |
A18N0094Pposudek-op.PDF | Posudek oponenta práce | 414,16 kB | Adobe PDF | Zobrazit/otevřít |
A18N0094Pobhajoba.PDF | Průběh obhajoby práce | 192,36 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/37423
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.