Název: Vyhledávání slov v rozsáhlém archívu mluvené řeči
Další názvy: Spoken term detection in a large spoken archive
Autoři: Vavruška, Jan
Vedoucí práce/školitel: Švec, Jan
Oponent: Ircing, Pavel
Datum vydání: 2012
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/2655
Klíčová slova: vyhledávání slov v řečovém archivu;automatické rozpoznávání řeči;slovní a fonémové mřížky;vážené konečné automaty a transducery;projekt MALACH;STDTools;OpenFST
Klíčová slova v dalším jazyce: spoken term detection;automatic speech recognition;word and phoneme lattices;weighted finite-state automata and transducers;STDTools;OpenFST;project MALACH
Abstrakt: Tato práce se zabývá metodami pro úlohu vyhledávání slov v rozsáhlém archivu mluvené řeči. Vyhledávání v takovém archivu je umožněno prostřednictvím indexace slovních a fonémových mřížek, které jsou výstupem systému automatického rozpoznávání řeči. Hlavním cílem práce bylo nastudovat a aplikovat přístup k indexaci a vyhledávání v mřížkách s využitím teorie vážených konečných automatů a nástrojů STDTools. Následně jej pak otestovat na zvolených experimentálních datech a porovnat se systémem, založeným na indexaci vybraných mřížkových hran. Porovnávání probíhalo vyhodnocením přístupu z hlediska jeho přesnosti, rychlosti vyhledávání a nároků na datový prostor.
Abstrakt v dalším jazyce: The focus of this thesis is the Spoken Term Detection (STD) task whose aim is to index and search word and phoneme lattices resulting from the Automatic Speech Recognition (ASR) system. The main goal of this thesis was to thoroughly familiarize with the theory of weighted finite-state automata (WFSA) and then implement a spoken term detection system using existing software framework (STDTools). Consequently, the implemented system has been tested on the large real-world data and results were compared with the existing STD engine developed previously within the research group. The comparison was based on the evaluation of precision, search time and also data storage requirements.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Diplomové práce / Theses (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
ZCU-FAV-KKY-Vavruska-DP.pdfPlný text práce1,27 MBAdobe PDFZobrazit/otevřít
vavruska-v.pdfPosudek vedoucího práce1,96 MBAdobe PDFZobrazit/otevřít
vavruska-o.pdfPosudek oponenta práce1,92 MBAdobe PDFZobrazit/otevřít
vavruska-p.pdfPrůběh obhajoby práce1,45 MBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/2655

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.