Title: Prohledávání dokumentů podle automaticky extrahovaných vzorů
Other Titles: Document retrieval using automaticaly extracted patterns
Authors: Baloun, Josef
Advisor: Král Pavel, Doc. Ing. Ph.D.
Referee: Lenc Ladislav, Ing. Ph.D.
Issue Date: 2018
Publisher: Západočeská univerzita v Plzni
Document type: bakalářská práce
URI: http://hdl.handle.net/11025/32259
Keywords: vyhledávání slov;ručně psané dokumenty;databáze parzival;neuronová síť;konvoluční neuronová síť;phoc vektor;spatial pyramid pooling;konvoluční lstm;experiment;mean average precision
Keywords in different language: word spotting;handwritten documents;parzival database;neural network;convolutional neural network;phoc vector;spatial pyramid pooling;convolutional lstm;experiment;mean average precision
Abstract: Tato bakalářská práce se zabývá návrhem a implementací metod, které umožní vyhledávání slov v ručně psaném textu. Předpokladem je již hotová segmentace dokumentu na obrázky slov. V první části práce jsou zmapovány dostupné datové kolekce pro vyhledávání v ručně psaných textech. Následuje seznámení s možnými řešeními, mezi kterými jsou zvoleny neuronové sítě. V druhé části jsou provedeny experimenty na datové kolekci Parzival. Účelem experimentů je ověření funkčnosti metod, hledání vhodné architektury sítě a zjištění vlivu jednotlivých částí metod na výsledek. Navrženy jsou tři metody založené na neuronových sítích, které se dokáží vypořádat s rozdílnou velikostí vstupních obrázků třemi způsoby. Tyto metody jsou otestovány a porovnány na databázi Parzival, kde dosáhli výborných výsledků. Nejlep- ších výsledků 92,62 % MAP QbS a 90,01 % MAP QbE bylo dosaženo s metodou, která je založena na konvoluční neuronové síti a PHOC reprezentaci výstupního vektoru.
Abstract in different language: This bachelor thesis deals with the design and implementation of methods that allow the search of handwritten words. A prerequisite is the ready segmentation of the document to the word images. In the first part of the thesis, the available data collections are mapped for searching in handwritten texts, followed by a list of possible solutions among which neural networks are selected. In the second part, experiments are performed on the Parzival data collection. The purpose of the experiments is to verify the functionality of the methods, a search for an appropriate network architecture and to determine the effect of the individual parts of the methods on the result. Three methods based on neural networks are designed to deal with the different sizes of input images in three ways. These methods are tested and compared on the Parzival database where they have achieved excellent results. The best results of 92,62 % MAP QbS and 90,01 % MAP QbE were achieved with a method based on the convolutional neural network and the PHOC representation of the output vector.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Bakalářské práce / Bachelor´s works (KIV)

Files in This Item:
File Description SizeFormat 
balounj_bakalarka.pdfPlný text práce3 MBAdobe PDFView/Open
A15B0005P posudek.pdfPosudek oponenta práce277,82 kBAdobe PDFView/Open
A15B0005P hodnoceni.pdfPosudek vedoucího práce167,88 kBAdobe PDFView/Open
A15B0005P obhajoba.pdfPrůběh obhajoby práce84,08 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/32259

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.