Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorVít, Jakub
dc.contributor.authorHanzlíček, Zdeněk
dc.contributor.authorMatoušek, Jindřich
dc.date.accessioned2020-03-23T11:00:23Z-
dc.date.available2020-03-23T11:00:23Z-
dc.date.issued2019
dc.identifier.citationVÍT, J., HANZLÍČEK, Z., MATOUŠEK, J. Czech Speech Synthesis with Generative Neural Vocoder. In: Text, Speech, and Dialogue 22nd International Conference, TSD 2019, Ljubljana,Slovenia, September 11-13, 2019, Proceedings. Cham: Springer, 2019. s. 307-315. ISBN 978-3-030-27946-2 , ISSN 0302-9743.en
dc.identifier.isbn978-3-030-27946-2
dc.identifier.issn0302-9743
dc.identifier.uri2-s2.0-85072849542
dc.identifier.urihttp://hdl.handle.net/11025/36715
dc.description.abstractIn recent years, new neural architectures for generating high-quality synthetic speech on a per-sample basis were introduced. We describe our application of statistical parametric speech synthesis based on LSTM neural networks combined with a generative neural vocoder for the Czech language. We used a traditional LSTM architecture for generating vocoder parametrization from linguistic features. We replaced a standard vocoder with a WaveRNN neural network. We conducted a MUSHRA listening test to compare the proposed approach with the unit selection and LSTM-based parametric speech synthesis utilizing a standard vocoder. In contrast with our previous work, we managed to outperform a well-tuned unit selection TTS system by a great margin on both professional and amateur voices.en
dc.format9 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherSpringeren
dc.relation.ispartofseriesText, Speech, and Dialogue 22nd International Conference, TSD 2019, Ljubljana,Slovenia, September 11-13, 2019, Proceedingsen
dc.rightsPlný text není přístupný.cs
dc.rights© Springeren
dc.titleCzech Speech Synthesis with Generative Neural Vocoderen
dc.typekonferenční příspěvekcs
dc.typeconferenceObjecten
dc.rights.accessclosedAccessen
dc.type.versionpublishedVersionen
dc.subject.translatedSpeech synthesis, LSTM-based speech synthesis, WaveRNN, Neural vocoder, Unit selectionen
dc.identifier.doi10.1007/978-3-030-27947-9_26
dc.type.statusPeer-revieweden
dc.identifier.obd43926904
dc.project.IDSGS-2019-027/Inteligentní metody strojového vnímání a porozumění 4cs
dc.project.IDGA19-19324S/Plně trénovatelná syntéza české řeči z textu s využitím hlubokých neuronových sítícs
Vyskytuje se v kolekcích:Konferenční příspěvky / Conference papers (NTIS)
Konferenční příspěvky / Conference Papers (KKY)
OBD

Soubory připojené k záznamu:
Soubor VelikostFormát 
Vit2019_Chapter_CzechSpeechSynthesisWithGenera.pdf401,08 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/36715

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání
navigace
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD