Full metadata record
DC pole | Hodnota | Jazyk |
---|---|---|
dc.contributor.advisor | Ekštein Kamil, Ing. Ph.D. | |
dc.contributor.author | Patera, Patrik | |
dc.contributor.referee | Mautner Pavel, Ing. Ph.D. | |
dc.date.accepted | 2020-6-22 | |
dc.date.accessioned | 2020-11-10T00:38:41Z | - |
dc.date.available | 2019-9-11 | |
dc.date.available | 2020-11-10T00:38:41Z | - |
dc.date.issued | 2020 | |
dc.date.submitted | 2020-5-20 | |
dc.identifier | 82498 | |
dc.identifier.uri | http://hdl.handle.net/11025/41758 | |
dc.description.abstract | Tato diplomová práce se zabývá problémy z oblasti počítačového vidění k automatizované extrakci užitečných informací z naskenovaných dokumentů (obrazových dat) dle uživatelsky definovaných šablon. Hlavním cílem bylo analyzovat používané techniky a nástroje zaměřující se na zpracování digitálních snímků s následným optickým rozpoznáním znaků (OCR) z textových oblastí. Na základě analýzy byl navržen a implementován software pro tvorbu šablon dokumentů s grafickým uživatelským rozhraním a modul pro práci s naskenovanými dokumenty, který podle příslušné šablony extrahuje oblasti s užitečnými informaci a ty předá OCR systému. Implementované algoritmy byly podrobeny evaluačním testům k získání přehledu o jejich funkčnosti a robustnosti s ohledem k zamýšlenému účelu, jejichž výstup byl shrnut v závěru této práce. Nejlépe vyhodnocené algoritmy s konfigurovatelnými vstupními parametry jsou v aplikaci nastaveny jako výchozí. | cs |
dc.format | 131 s. (198189 znaků) | cs |
dc.format.mimetype | application/pdf | |
dc.language.iso | cs | cs |
dc.publisher | Západočeská univerzita v Plzni | cs |
dc.relation.isreferencedby | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=82498 | - |
dc.rights | Plný text práce je přístupný bez omezení. | cs |
dc.subject | počítačové vidění | cs |
dc.subject | zpracování obrazu | cs |
dc.subject | hledání vzoru | cs |
dc.subject | extrakce informací | cs |
dc.subject | šablony dokumentů | cs |
dc.subject | ocr | cs |
dc.subject | tesseract | cs |
dc.subject | opencv | cs |
dc.subject | c++ | cs |
dc.title | Extrakce údajů z heterogenních dokumentů pomocí šablon | cs |
dc.title.alternative | Information Extraction From Heterogeneous Documents Using Templates | en |
dc.type | diplomová práce | cs |
dc.thesis.degree-name | Ing. | cs |
dc.thesis.degree-level | Navazující | cs |
dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
dc.thesis.degree-program | Inženýrská informatika | cs |
dc.description.result | Obhájeno | cs |
dc.rights.access | openAccess | en |
dc.description.abstract-translated | This master's thesis deals with the challenges of automatic content extraction from regions of interest located in scanned documents (images) on the basis of user's defined templates, as a part of the computer vision domain. The main goal was to analyse common techniques and frameworks used for digital image processing followed by optical character recognition (OCR) performed in the text areas. In consonance with the analysis, the software for template creation with an extensive user graphics interface was designed and implemented as well as the module to handle and extract the regions of interest defined by an appropriate template from scanned documents and subsequently passing them to the OCR system. The implemented algorithms were evaluated to get an overview of their functionality and robustness with regard to the subject matter, the results of which are summarized in the conclusion. As a result of the evaluation, the best-rated algorithms with configurable input parameters are set as the default ones in the application. | en |
dc.subject.translated | computer vision | en |
dc.subject.translated | image processing | en |
dc.subject.translated | template matching | en |
dc.subject.translated | information extraction | en |
dc.subject.translated | document template | en |
dc.subject.translated | ocr | en |
dc.subject.translated | tesseract | en |
dc.subject.translated | opencv | en |
dc.subject.translated | c++ | en |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
paterap_diploma.pdf | Plný text práce | 6,46 MB | Adobe PDF | Zobrazit/otevřít |
A17N0083Phodnoceni-ved.PDF | Posudek vedoucího práce | 1,15 MB | Adobe PDF | Zobrazit/otevřít |
A17N0083Pposudek-op.pdf | Posudek oponenta práce | 45,9 kB | Adobe PDF | Zobrazit/otevřít |
A17N0083Pobhajoba.PDF | Průběh obhajoby práce | 312,38 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/41758
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.