Using Auto-Encoder BiLSTM Neural Network for Czech Grapheme-to-Phoneme Conversion

Jůzová, Markéta; Vít, Jakub

Full metadata record

DC pole	Hodnota	Jazyk
dc.contributor.author	Jůzová, Markéta
dc.contributor.author	Vít, Jakub
dc.date.accessioned	2020-03-09T11:00:21Z	-
dc.date.available	2020-03-09T11:00:21Z	-
dc.date.issued	2019
dc.identifier.citation	JŮZOVÁ, M.., VÍT, J.. Using Auto-Encoder BiLSTM Neural Network for Czech Grapheme-to-Phoneme Conversion. In Text, Speech, and Dialogue 22nd International Conference, TSD 2019, Ljubljana,Slovenia, September 11-13, 2019, Proceedings. Cham: Springer, 2019. s. 91-102. ISBN: 978-3-030-27946-2 , ISSN: 0302-9743	en
dc.identifier.isbn	978-3-030-27946-2
dc.identifier.issn	0302-9743
dc.identifier.uri	2-s2.0-85072870003
dc.identifier.uri	http://hdl.handle.net/11025/36610
dc.description.abstract	Důležitou součástí téměř všech současných systémů TTS je konverze grafémů na fonémy (G2P), tj. transkripce jakékoli vstupní sekvence grafémů do správné sekvence fonémů v daném jazyce. Příprava transkripčních pravidel a slovníků výslovnosti bohužel není snadným procesem pro nové jazyky v systémech TTS. Z tohoto důvodu se v předkládané práci zaměřujeme na vytvoření automatického modelu G2P založeného na neuronových sítích (NN). Na rozdíl od většiny souvisejících prací v oboru G2P, kde se jako vstup používají pouze samostatná slova, považujeme za vstup našeho navrhovaného modelu NN celou frázi. Tento přístup by podle našeho názoru měl vést k přesnější fonetické transkripci, protože výslovnost slova může záviset na okolních slovech. Výsledky natrénovaného modelu G2P jsou prezentovány na českém jazyce, kde k spodobě znělosti přes hranici slov dochází poměrně často, a jsou porovnávány s přístupem založeným na pravidlech.	cs
dc.format	12 s.	cs
dc.format.mimetype	application/pdf
dc.language.iso	en	en
dc.publisher	Springer	en
dc.relation.ispartofseries	Text, Speech, and Dialogue 22nd International Conference, TSD 2019, Ljubljana,Slovenia, September 11-13, 2019, Proceedings	en
dc.rights	Plný text není přístupný.	cs
dc.rights	© Springer	en
dc.subject	převod grafémy-fonémy, sequence-to-sequence, neuronové sítě, encoder-decoder model, Česká fonetická transkripce	cs
dc.title	Using Auto-Encoder BiLSTM Neural Network for Czech Grapheme-to-Phoneme Conversion	en
dc.title.alternative	Použití obousměrné LSTM neuronové sítě pro českou fonetickou transkripci	cs
dc.type	konferenční příspěvek	cs
dc.type	conferenceObject	en
dc.rights.access	closedAccess	en
dc.type.version	publishedVersion	en
dc.description.abstract-translated	The crucial part of almost all current TTS systems is a grapheme-to-phoneme (G2P) conversion, i.e. the transcription of any input grapheme sequence into the correct sequence of phonemes in the given language. Unfortunately, the preparation of transcription rules and pronunciation dictionaries is not an easy process for new languages in TTS systems. For that reason, in the presented paper, we focus on the creation of an automatic G2P model, based on neural networks (NN). But, contrary to the majority of related works in G2P field, using only separate words as an input, we consider a whole phrase the input of our proposed NN model. That approach should, in our opinion, lead to more precise phonetic transcription output because the pronunciation of a word can depend on the surrounding words. The results of the trained G2P model are presented on the Czech language where the cross-word-boundary phenomena occur quite often, and they are compared to the rule-based approach.	en
dc.subject.translated	grapheme-to-phoneme, sequence-to-sequence, neural networks, encoder-decoder model, Czech phonetic transcription	en
dc.identifier.doi	10.1007/978-3-030-27947-9_8
dc.type.status	Peer-reviewed	en
dc.identifier.obd	43926896
dc.project.ID	GA19-19324S/Plně trénovatelná syntéza české řeči z textu s využitím hlubokých neuronových sítí	cs
dc.project.ID	SGS-2019-027/Inteligentní metody strojového vnímání a porozumění 4	cs
Vyskytuje se v kolekcích:	Konferenční příspěvky / Conference Papers (KKY) OBD

Soubory připojené k záznamu:

Soubor	Velikost	Formát
Juzova-Vit2019_Chapter_UsingAuto-EncoderBiLSTMNeuralN.pdf	698,01 kB	Adobe PDF	Zobrazit/otevřít Vyžádat kopii

Zobrazit minimální záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/36610

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace