Extrakce údajů z heterogenních dokumentů pomocí šablon

Patera, Patrik

Full metadata record

DC pole	Hodnota	Jazyk
dc.contributor.advisor	Ekštein Kamil, Ing. Ph.D.
dc.contributor.author	Patera, Patrik
dc.contributor.referee	Mautner Pavel, Ing. Ph.D.
dc.date.accepted	2020-6-22
dc.date.accessioned	2020-11-10T00:38:41Z	-
dc.date.available	2019-9-11
dc.date.available	2020-11-10T00:38:41Z	-
dc.date.issued	2020
dc.date.submitted	2020-5-20
dc.identifier	82498
dc.identifier.uri	http://hdl.handle.net/11025/41758
dc.description.abstract	Tato diplomová práce se zabývá problémy z oblasti počítačového vidění k automatizované extrakci užitečných informací z naskenovaných dokumentů (obrazových dat) dle uživatelsky definovaných šablon. Hlavním cílem bylo analyzovat používané techniky a nástroje zaměřující se na zpracování digitálních snímků s následným optickým rozpoznáním znaků (OCR) z textových oblastí. Na základě analýzy byl navržen a implementován software pro tvorbu šablon dokumentů s grafickým uživatelským rozhraním a modul pro práci s naskenovanými dokumenty, který podle příslušné šablony extrahuje oblasti s užitečnými informaci a ty předá OCR systému. Implementované algoritmy byly podrobeny evaluačním testům k získání přehledu o jejich funkčnosti a robustnosti s ohledem k zamýšlenému účelu, jejichž výstup byl shrnut v závěru této práce. Nejlépe vyhodnocené algoritmy s konfigurovatelnými vstupními parametry jsou v aplikaci nastaveny jako výchozí.	cs
dc.format	131 s. (198189 znaků)	cs
dc.format.mimetype	application/pdf
dc.language.iso	cs	cs
dc.publisher	Západočeská univerzita v Plzni	cs
dc.relation.isreferencedby	https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=82498	-
dc.rights	Plný text práce je přístupný bez omezení.	cs
dc.subject	počítačové vidění	cs
dc.subject	zpracování obrazu	cs
dc.subject	hledání vzoru	cs
dc.subject	extrakce informací	cs
dc.subject	šablony dokumentů	cs
dc.subject	ocr	cs
dc.subject	tesseract	cs
dc.subject	opencv	cs
dc.subject	c++	cs
dc.title	Extrakce údajů z heterogenních dokumentů pomocí šablon	cs
dc.title.alternative	Information Extraction From Heterogeneous Documents Using Templates	en
dc.type	diplomová práce	cs
dc.thesis.degree-name	Ing.	cs
dc.thesis.degree-level	Navazující	cs
dc.thesis.degree-grantor	Západočeská univerzita v Plzni. Fakulta aplikovaných věd	cs
dc.thesis.degree-program	Inženýrská informatika	cs
dc.description.result	Obhájeno	cs
dc.rights.access	openAccess	en
dc.description.abstract-translated	This master's thesis deals with the challenges of automatic content extraction from regions of interest located in scanned documents (images) on the basis of user's defined templates, as a part of the computer vision domain. The main goal was to analyse common techniques and frameworks used for digital image processing followed by optical character recognition (OCR) performed in the text areas. In consonance with the analysis, the software for template creation with an extensive user graphics interface was designed and implemented as well as the module to handle and extract the regions of interest defined by an appropriate template from scanned documents and subsequently passing them to the OCR system. The implemented algorithms were evaluated to get an overview of their functionality and robustness with regard to the subject matter, the results of which are summarized in the conclusion. As a result of the evaluation, the best-rated algorithms with configurable input parameters are set as the default ones in the application.	en
dc.subject.translated	computer vision	en
dc.subject.translated	image processing	en
dc.subject.translated	template matching	en
dc.subject.translated	information extraction	en
dc.subject.translated	document template	en
dc.subject.translated	ocr	en
dc.subject.translated	tesseract	en
dc.subject.translated	opencv	en
dc.subject.translated	c++	en
Vyskytuje se v kolekcích:	Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
paterap_diploma.pdf	Plný text práce	6,46 MB	Adobe PDF	Zobrazit/otevřít
A17N0083Phodnoceni-ved.PDF	Posudek vedoucího práce	1,15 MB	Adobe PDF	Zobrazit/otevřít
A17N0083Pposudek-op.pdf	Posudek oponenta práce	45,9 kB	Adobe PDF	Zobrazit/otevřít
A17N0083Pobhajoba.PDF	Průběh obhajoby práce	312,38 kB	Adobe PDF	Zobrazit/otevřít

Zobrazit minimální záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/41758

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace