Název: | Context-dependent ASR: technical report no. DCSE/TR-2009-12 |
Autoři: | Hejtmánek, Jan |
Datum vydání: | 2009 |
Nakladatel: | University of West Bohemia in Pilsen |
Typ dokumentu: | zpráva report |
URI: | http://www.kiv.zcu.cz/publications/ http://hdl.handle.net/11025/21578 |
Klíčová slova: | rozpoznávání řeči;prozodie |
Klíčová slova v dalším jazyce: | speech recognition;prosody |
Abstrakt v dalším jazyce: | Computer speech recognition gains more and more attention these days with its implementation in nearly everyday life. But the ultimate goal is still out of reach. The automatic recognition (ASR) systems can very precisely work on small domain. However the bigger the domain is the worse is the performance of the ASR system. The aim of many researchers is to diminish this problem on various levels of the ASR. This work describes components of an ASR system, how they are working together and delves into prosody and how it is used in ASR. From the usage of prosody, the main part of work describes how the ASR can be improved better modeling of the speech variance. We discuss usage of triphones, syllables and other models as well as algorithms and techniques for clustering. |
Práva: | © University of West Bohemia in Pilsen |
Vyskytuje se v kolekcích: | Zprávy / Reports (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
Hejtmanek.pdf | Plný text | 1,37 MB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/21578
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.