Title: Automatické rozpoznávání typů otázek v různých jazycích
Other Titles: Automatic question types detection in different languages
Authors: Kašáková, Tereza
Advisor: Řezáčková Markéta, Ing.
Referee: Kunešová Marie, Ing. Ph.D.
Issue Date: 2023
Publisher: Západočeská univerzita v Plzni
Document type: bakalářská práce
URI: http://hdl.handle.net/11025/55116
Keywords: tts;syntéza řeči;zpracování přirozeného jazyka;intonace;otázky;svm;t5
Keywords in different language: tts;speech synthesis;natural language processing;intonation;questions;svm;t5
Abstract: Tématem této práce je automatické rozpoznávání typů otázek v různých jazycích. Práce analyzuje typy vět a typy otázek, zaměřuje se na jejich intonaci a popisuje její pravidla v různých jazycích. Na problematiku se dívá z hlediska syntézy řeči, zvýrazňuje důležitost správného generování prozodie a konkrétně typického tónu různých typů otázek, aby umělá řeč byla co nejpřirozenější. Důležité je tudíž při předzpracování textu před jeho samotnou syntézou automaticky rozlišovat typy otázek. Předkládaná práce se o to snaží využitím pravidel, klasifikátorů a neuronové sítě T5. Tyto přístupy testuje pro data v několika jazycích a porovnává jejich přesnosti při klasifikaci otázek.
Abstract in different language: The subject of this thesis is the automatic recognition of question types in various languages. The thesis analyzes types of sentences and types of questions, focuses on their intonation and describes its rules in different languages. The issue is looked at from the perspective of speech synthesis, it emphasizes the importance of the correct generation of prosody and, in particular, the typical tone of different types of questions, so that artificial speech is as natural as possible. It is therefore important to automatically distinguish between the types of questions when pre-processing the text before the synthesis. The current work aims to do so using rules, classifiers and the T5 neural network. These approaches are tested using data in several languages and their accuracy values for question types classification are compared.
