Title: Hybrid syllable/triphone speech synthesis
Other Titles: Hybridní syntéza řeči s využitím slabik a trifónů
Authors: Matoušek, Jindřich
Hanzlíček, Zdeněk
Tihelka, Daniel
Citation: MATOUŠEK, Jindřich; HANZLÍČEK, Zdeněk; TIHELKA, Daniel. Hybrid syllable/triphone speech synthesis. In: Proceedings of ICSPL 2005: 6th Annual Conference of the International Speech Communication Association 2005, Lisboa, Portugal, 4-8 September 2005. [Baixas]: ISCA, 2005, p. 2529-2532. ISSN 1990-9772.
Issue Date: 2005
Publisher: ISCA
Document type: článek
article
URI: http://www.kky.zcu.cz/cs/publications/MatousekJ_2005_Hybrid
http://hdl.handle.net/11025/17025
ISSN: 1990-9772
Keywords: automatické vytváření inventáře akustických jednotek;slabika;trifón;modelování­ slabik;syntéza řeči
Keywords in different language: automatic acoustic unit inventory creation;syllable;triphone;syllable modelling;speech synthesis
Abstract: V článku jsou zkoumány možnosti využití slabiky, alternativní fonetické jednotky k hlásce, v úloze syntézy řeči. Je zde navrženo a vyhodnoceno několik přístupů k modelování slabik v rámci statistického přístupu (s využitím skrytých Markovových modelů) k vytvoření inventáře akustických jednotek. Aby bylo možné syntetizovat libovolný text, byly slabičné inventáře doplněny o trifóny, což vedlo ke vzniku hybridních slabičných a trifónových inventářů. K hodnocení kvality výsledné syntetické řeči a ke zvolení nejlepšího přístupu k modelování slabik byly provedeny poslechové testy. Výsledná syntetická řeč je vysoce srozumitelná a plynulá. Ačkoliv syntetická řeč vytvářená na základě původního trifónového inventáře byla hodnocena o něco lépe, výsledky prvních experimentů s použitím slabik jsou velmi nadějné.
Abstract in different language: In this paper, the syllable, an alternative phonetic unit to the phone, is researched in the context of speech synthesis. Several approaches to syllable modelling within the statistical approach (using hidden Markov models) to the acoustic unit inventory creation are proposed and evaluated. To be able to synthesize an arbitrary text, the syllable inventories were supplemented with triphones resulting in hybrid syllable/triphone inventories. Listening tests were accomplished both to assess the quality of the resulting synthetic speech produced using the hybrid syllable/triphone inventories and to choose the best approach to syllable modelling. The resulting synthetic speech is highly intelligible and fluent. Although the synthetic speech generated using the baseline triphone inventory was assessed slightly better, the results of the very first experiments with syllable modelling are very promising.
Rights: © Jindřich Matoušek - Zdeněk Hanzlíček - Daniel Tihelka
Appears in Collections:Články / Articles (NTIS)
Články / Articles (KIV)

Files in This Item:
File Description SizeFormat 
MatousekJ_2005_Hybrid.pdfPlný text100,93 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/17025

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.