Název: Context-dependent ASR: technical report no. DCSE/TR-2009-12
Autoři: Hejtmánek, Jan
Datum vydání: 2009
Nakladatel: University of West Bohemia in Pilsen
Typ dokumentu: zpráva
URI: http://www.kiv.zcu.cz/publications/
Klíčová slova: rozpoznávání řeči;prozodie
Klíčová slova v dalším jazyce: speech recognition;prosody
Abstrakt v dalším jazyce: Computer speech recognition gains more and more attention these days with its implementation in nearly everyday life. But the ultimate goal is still out of reach. The automatic recognition (ASR) systems can very precisely work on small domain. However the bigger the domain is the worse is the performance of the ASR system. The aim of many researchers is to diminish this problem on various levels of the ASR. This work describes components of an ASR system, how they are working together and delves into prosody and how it is used in ASR. From the usage of prosody, the main part of work describes how the ASR can be improved better modeling of the speech variance. We discuss usage of triphones, syllables and other models as well as algorithms and techniques for clustering.
Práva: © University of West Bohemia in Pilsen
Vyskytuje se v kolekcích:Zprávy / Reports (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
Hejtmanek.pdfPlný text1,37 MBAdobe PDFZobrazit/otevřít

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/21578

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.