Název: How Much End-to-End is Tacotron 2 End-to-End TTS System
Autoři: Tihelka, Daniel
Matoušek, Jindřich
Tihelková, Alice
Citace zdrojového dokumentu: TIHELKA, D. MATOUŠEK, J. TIHELKOVÁ, A. How Much End-to-End is Tacotron 2 End-to-End TTS System. In Text, Speech, and Dialogue 24th International Conference, TSD 2021, Olomouc, Czech Republic, September 6–9, 2021, Proceedings. Cham: Springer International Publishing, 2021. s. 511-522. ISBN: 978-3-030-83526-2 , ISSN: 0302-9743
Datum vydání: 2021
Nakladatel: Springer International Publishing
Typ dokumentu: konferenční příspěvek
URI: 2-s2.0-85115273150
ISBN: 978-3-030-83526-2
ISSN: 0302-9743
Klíčová slova v dalším jazyce: End-to-end speech synthesis;Tacotron 2;WaveRNN;MelGan;Text processing;Homograph disambiguation;Prosody patterns
Abstrakt v dalším jazyce: In recent years, the concept of end-to-end text-to-speech synthesis has begun to attract the attention of researchers. The motivation is simple – replacing the individual modules that TTS traditionally built on with a powerful deep neural network simplifies the architecture of the entire system. However, how capable are such end-to-end systems of dealing with classic tasks such as G2P, text normalisation, homograph disambiguation and other issues inseparably linked to text-to-speech systems? In the present paper, we explore three free implementations of the Tacotron 2-based speech synthesizers, focusing on their abilities to transform the input text into correct pronunciation, not only in terms of G2P conversion but also in han- dling issues related to text analysis and the prosody patterns used.
Práva: Plný text je přístupný v rámci univerzity přihlášeným uživatelům.
© Springer
Vyskytuje se v kolekcích:Konferenční příspěvky / Conference papers (KAJ)
Konferenční příspěvky / Conference Papers (KKY)

Soubory připojené k záznamu:
Soubor VelikostFormát 
Tihelka2021_Chapter_HowMuchEnd-to-EndIsTacotron2En.pdf222,38 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/47247

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD