Název: | Vyhledávání slov v rozsáhlém archívu mluvené řeči |
Další názvy: | Spoken term detection in a large spoken archive |
Autoři: | Vavruška, Jan |
Vedoucí práce/školitel: | Švec, Jan |
Oponent: | Ircing, Pavel |
Datum vydání: | 2012 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/2655 |
Klíčová slova: | vyhledávání slov v řečovém archivu;automatické rozpoznávání řeči;slovní a fonémové mřížky;vážené konečné automaty a transducery;projekt MALACH;STDTools;OpenFST |
Klíčová slova v dalším jazyce: | spoken term detection;automatic speech recognition;word and phoneme lattices;weighted finite-state automata and transducers;STDTools;OpenFST;project MALACH |
Abstrakt: | Tato práce se zabývá metodami pro úlohu vyhledávání slov v rozsáhlém archivu mluvené řeči. Vyhledávání v takovém archivu je umožněno prostřednictvím indexace slovních a fonémových mřížek, které jsou výstupem systému automatického rozpoznávání řeči. Hlavním cílem práce bylo nastudovat a aplikovat přístup k indexaci a vyhledávání v mřížkách s využitím teorie vážených konečných automatů a nástrojů STDTools. Následně jej pak otestovat na zvolených experimentálních datech a porovnat se systémem, založeným na indexaci vybraných mřížkových hran. Porovnávání probíhalo vyhodnocením přístupu z hlediska jeho přesnosti, rychlosti vyhledávání a nároků na datový prostor. |
Abstrakt v dalším jazyce: | The focus of this thesis is the Spoken Term Detection (STD) task whose aim is to index and search word and phoneme lattices resulting from the Automatic Speech Recognition (ASR) system. The main goal of this thesis was to thoroughly familiarize with the theory of weighted finite-state automata (WFSA) and then implement a spoken term detection system using existing software framework (STDTools). Consequently, the implemented system has been tested on the large real-world data and results were compared with the existing STD engine developed previously within the research group. The comparison was based on the evaluation of precision, search time and also data storage requirements. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
ZCU-FAV-KKY-Vavruska-DP.pdf | Plný text práce | 1,27 MB | Adobe PDF | Zobrazit/otevřít |
vavruska-v.pdf | Posudek vedoucího práce | 1,96 MB | Adobe PDF | Zobrazit/otevřít |
vavruska-o.pdf | Posudek oponenta práce | 1,92 MB | Adobe PDF | Zobrazit/otevřít |
vavruska-p.pdf | Průběh obhajoby práce | 1,45 MB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/2655
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.