Název: | Detekce hlasivkových pulsů v řečovém signálu pomocí strojového učení |
Další názvy: | Machine learning based glottal closure instant detection |
Autoři: | Vraštil, Michal |
Vedoucí práce/školitel: | Matoušek Jindřich, Doc. Ing. Ph.D. |
Oponent: | Tihelka Daniel, Ing. Ph.D. |
Datum vydání: | 2020 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/41541 |
Klíčová slova: | uzávěr hlasivek;hlasivkový puls;detekce;klasifikace;extreme gradient boosting;python;konvoluční neuronová síť;kontextový klasifikátor |
Klíčová slova v dalším jazyce: | glottal closure instant;pitch mark;detection;classification;extreme gradient boosting;convolutional neural net;python;context aware classifier |
Abstrakt: | Tématem této diplomové práce je detekce hlasivkových pulsů v řečovém signálu pomocí metod strojového učení. Klade si za cíl vylepšit úspěšnost klasifikace výchozího algoritmu, a to především přidáním nových příznaků, nalezením dalších vhodných metod předzpracování řečového signálu a implementací kontextového klasifikátoru. V úvodu této práce je stručně popsána fyziologická tvorba řečového signálu a hlasivkových pulsů, jejich zpracování počítačem a význam a přínos jejich přesné detekce. Následně je představen výchozí algoritmus a čtenář je seznámen s postupem nalezení nových příznaků a nových metod předzpracování. Hlavního přínosu pro úspěšnost klasifikace je dosaženo implementací tzv. kontextového (angl. Context aware) klasifikátoru, který je pak použit pro zbytek práce. V závěru je vylepšený algoritmus porovnán s výchozím algoritmem a s dalšími vybranými algoritmy. Dále je pak ověřena jeho úspěšnost na datech, které prošly simulovaným telefonním kanálem a na datech stejně upravených, které byly navíc zašumělé bílým šumem. |
Abstrakt v dalším jazyce: | The topic of this diploma thesis is the detection of glottal closure instants from the speech signal using machine learning methods. It aims to improve the success of the classification of the initial algorithm, especially by adding new features and finding other suitable methods of speech signal preprocessing. The introduction of this work briefly describes the physiological production of speech and glottal closure instants, their computer processing and the importance and benefits of their accurate detection. Subsequently, the initial algorithm is introduced and the reader is introduced to the process of finding new features and new methods of preprocessing. The main benefit for the success of the classification is achieved by the implementation of the Context aware classifier, which is then used for the rest of the work. Finally, the improved algorithm is compared with the initial algorithm. Furthermore, its success is verified on data that have passed through the simulated telephone channel and on data that have been modified in the same way with added white noise. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
VrastilMDiplomka.pdf | Plný text práce | 1,56 MB | Adobe PDF | Zobrazit/otevřít |
vrastil-v.pdf | Posudek vedoucího práce | 944,86 kB | Adobe PDF | Zobrazit/otevřít |
vrastil-o.pdf | Posudek oponenta práce | 833,45 kB | Adobe PDF | Zobrazit/otevřít |
vrastil-p.pdf | Průběh obhajoby práce | 363,92 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/41541
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.