Title: | Detekce hlasivkových pulsů v řečovém signálu pomocí strojového učení |
Other Titles: | Machine learning based glottal closure instant detection |
Authors: | Vraštil, Michal |
Advisor: | Matoušek Jindřich, Doc. Ing. Ph.D. |
Referee: | Tihelka Daniel, Ing. Ph.D. |
Issue Date: | 2020 |
Publisher: | Západočeská univerzita v Plzni |
Document type: | diplomová práce |
URI: | http://hdl.handle.net/11025/41541 |
Keywords: | uzávěr hlasivek;hlasivkový puls;detekce;klasifikace;extreme gradient boosting;python;konvoluční neuronová síť;kontextový klasifikátor |
Keywords in different language: | glottal closure instant;pitch mark;detection;classification;extreme gradient boosting;convolutional neural net;python;context aware classifier |
Abstract: | Tématem této diplomové práce je detekce hlasivkových pulsů v řečovém signálu pomocí metod strojového učení. Klade si za cíl vylepšit úspěšnost klasifikace výchozího algoritmu, a to především přidáním nových příznaků, nalezením dalších vhodných metod předzpracování řečového signálu a implementací kontextového klasifikátoru. V úvodu této práce je stručně popsána fyziologická tvorba řečového signálu a hlasivkových pulsů, jejich zpracování počítačem a význam a přínos jejich přesné detekce. Následně je představen výchozí algoritmus a čtenář je seznámen s postupem nalezení nových příznaků a nových metod předzpracování. Hlavního přínosu pro úspěšnost klasifikace je dosaženo implementací tzv. kontextového (angl. Context aware) klasifikátoru, který je pak použit pro zbytek práce. V závěru je vylepšený algoritmus porovnán s výchozím algoritmem a s dalšími vybranými algoritmy. Dále je pak ověřena jeho úspěšnost na datech, které prošly simulovaným telefonním kanálem a na datech stejně upravených, které byly navíc zašumělé bílým šumem. |
Abstract in different language: | The topic of this diploma thesis is the detection of glottal closure instants from the speech signal using machine learning methods. It aims to improve the success of the classification of the initial algorithm, especially by adding new features and finding other suitable methods of speech signal preprocessing. The introduction of this work briefly describes the physiological production of speech and glottal closure instants, their computer processing and the importance and benefits of their accurate detection. Subsequently, the initial algorithm is introduced and the reader is introduced to the process of finding new features and new methods of preprocessing. The main benefit for the success of the classification is achieved by the implementation of the Context aware classifier, which is then used for the rest of the work. Finally, the improved algorithm is compared with the initial algorithm. Furthermore, its success is verified on data that have passed through the simulated telephone channel and on data that have been modified in the same way with added white noise. |
Rights: | Plný text práce je přístupný bez omezení. |
Appears in Collections: | Diplomové práce / Theses (KKY) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
VrastilMDiplomka.pdf | Plný text práce | 1,56 MB | Adobe PDF | View/Open |
vrastil-v.pdf | Posudek vedoucího práce | 944,86 kB | Adobe PDF | View/Open |
vrastil-o.pdf | Posudek oponenta práce | 833,45 kB | Adobe PDF | View/Open |
vrastil-p.pdf | Průběh obhajoby práce | 363,92 kB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11025/41541
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.