Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorHanzlíček, Zdeněk
dc.contributor.authorVít, Jakub
dc.contributor.authorŘezáčková, Markéta
dc.date.accessioned2022-03-28T10:00:27Z-
dc.date.available2022-03-28T10:00:27Z-
dc.date.issued2021
dc.identifier.citationHANZLÍČEK, Z. VÍT, J. ŘEZÁČKOVÁ, M. Speakers Talking Foreign Languages in a Multi-lingual TTS System. In Text, Speech, and Dialogue 24th International Conference, TSD 2021, Olomouc, Czech Republic, September 6–9, 2021, Proceedings. Cham: Springer International Publishing, 2021. s. 489-498. ISBN: 978-3-030-83526-2 , ISSN: 0302-9743cs
dc.identifier.isbn978-3-030-83526-2
dc.identifier.issn0302-9743
dc.identifier.uri2-s2.0-85115270565
dc.identifier.urihttp://hdl.handle.net/11025/47246
dc.description.abstractČlánek popisuje experimenty s vícejazyčnými systémy syntézy řeči trénovanými společně z anglických, německých, ruských a českých dat. Experimentální systém založený na LSTM neuronových sítích a trénovatelný neuronový vokodér využívají mezinárodní fonetickou abecedu (IPA), což umožňuje přímou kombinaci různých jazyků. Článek porovnává, zda je společný model schopný spojit a zobecnit informaci obsaženou v trénovacích datech a zda je možné použít jednotlivé hlasy k syntéze jiných jazyků, včetně hlásek specifických pro jednotlivé jazyky. Srozumitelnost generované řeči byla ohodnocena s využitím SUS poslechových testů. Vícejazyčné modely byly rovněž porovnány s nezávislými jednojazyčními modely, kde chybějící cizí hlásky byly nahrazeny nejpodobnějšími hláskami přítomnými v daném jazyku. V poslechových testech byly jednoznačně preferovány vícejazyčné modely.cs
dc.format10 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherSpringer International Publishingen
dc.relation.ispartofseriesText, Speech, and Dialogue 24th International Conference, TSD 2021, Olomouc, Czech Republic, September 6–9, 2021, Proceedingsen
dc.rightsPlný text je přístupný v rámci univerzity přihlášeným uživatelům.cs
dc.rights© Springeren
dc.subjectsyntéza řečics
dc.subjectvícejazyčné systémy syntézy řečics
dc.titleSpeakers Talking Foreign Languages in a Multi-lingual TTS Systemen
dc.title.alternativeŘečnící hovořící cizími jazyky ve vícejazyčném systému syntézy řečics
dc.typekonferenční příspěvekcs
dc.typeConferenceObjecten
dc.rights.accessrestrictedAccessen
dc.type.versionpublishedVersionen
dc.description.abstract-translatedThis paper presents experiments with a multi-lingual multi-speaker TTS synthesis system jointly trained on English, German, Russian, and Czech speech data. The experimental LSTM-based TTS system with a trainable neural vocoder utilizes the International Phonetic Alphabet (IPA) which allows a straight combination of different languages. We analyzed whether the joint model is capable to generalize and mix the information contained in the training data and whether particular voices can be used for the synthesis of different languages, including the language-specific phonemes. The intelligibility of generated speech was assessed by an SUS (Semantically Unpredictable Sentences) listening tests containing Czech sentences spoken by non-Czech speakers. The performance of the joint multi-lingual model was also compared with independent single-voice models where the missing non-native phonemes were mapped to the most similar native phonemes. Besides the Czech sentences, the preference test also contained the English sentences spoken by Czech voices. The multi-lingual model was preferred for all evaluated voices. Although the generated speech did not sound like a native speaker, the phonetic and prosodic features were definitely better.en
dc.subject.translatedSpeech synthesisen
dc.subject.translatedMulti-lingual TTSen
dc.identifier.doi10.1007/978-3-030-83527-9_42
dc.type.statusPeer-revieweden
dc.identifier.obd43933410
dc.project.IDGA19-19324S/Plně trénovatelná syntéza české řeči z textu s využitím hlubokých neuronových sítícs
dc.project.IDSGS-2019-027/Inteligentní metody strojového vnímání a porozumění 4cs
dc.project.ID90140/Velká výzkumná infrastruktura_(J) - e-INFRA CZcs
Vyskytuje se v kolekcích:Konferenční příspěvky / Conference Papers (KKY)
OBD

Soubory připojené k záznamu:
Soubor VelikostFormát 
Hanzlíček2021_Chapter_SpeakersTalkingForeignLanguage.pdf283,93 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/47246

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání
navigace
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD