Title: Rozpoznávání řeči pacientů po totální laryngektomii komunikujících pomocí elektrolarynxu
Other Titles: Speech recognition of patients after total laryngectomy communicating by electrolarynx
Authors: Stanislav, Petr
Issue Date: 2020
Publisher: Západočeská univerzita v Plzni
Document type: disertační práce
URI: http://hdl.handle.net/11025/41889
Keywords: rozpoznávání řeči;totální laryngektomie;elektrolarynx;duration model;tdnn;dnn
Keywords in different language: automatic speech recognition;total laryngectomy;electrolarynx;duration model;tdnn;dnn
Abstract: Předkládaná disertační práce se zabývá problematikou rozpoznávání řeči pacientů, kteří podstoupili totální laryngektomii, a k produkci hlasu využívají elektrolarynx. V první části práce jsou přiblíženy důvody ztráty hlasu a metody, které jsou v současnosti využívány pro jeho rehabilitaci spolu s~jejich principy. Významnou pomoc s rehabilitací hlasu mohou poskytnout řečové technologie zpracovávající přirozenou řeč. Z tohoto důvodu jsou v práci popsány metody, které jsou využívány pro konstrukci automatických systémů rozpoznávání řeči (ASR). S ohledem na specifika řeči generované za pomoci elektrolarynxu je v práci prezentován postup pro sestavení speciálního řečového korpusu složeného z nahrávek hlasu pacienta po totální laryngektomii. Specifická řečová data slouží následně pro otestování robustnosti obecného systému rozpoznávání řeči. Získané výsledky však indikují potřebu navrhnout speciální ASR systém s individuálními požadavky vzhledem ke specifikům rozpoznávané řeči. Následně je navrženo několik postupů úpravy akustických dat za účelem zvýšení přesnosti rozpoznávání. Jako nejúčinnější se ukázalo protažení neznělých fonémů, proto byl vyvíjený ASR systém rozšířen o modul zohledňující právě toto protažení. V práci je popsáno nemalé množství experimetů, které byly provedeny za účelem ověření dílčích hypotéz.
Abstract in different language: This dissertation thesis deals with speech recognition of patients who have undergone total laryngectomy and who use electrolarynx for voice production. In the first part of the thesis, the reasons of voice loss and methods that are currently used for its rehabilitation together with their principles are described. Significant help with voice rehabilitation can be provided by speech technologies processing natural speech. For this reason, the methods that are used for the construction of automatic speech recognition systems (ASR) are described. Regarding the specifics of speech generated with the help of electrolarynx, the paper presents a procedure for assembling a special speech corpus consisting of recordings of the patient's voice after total laryngectomy. The specific speech data is then used to test the robustness of the general speech recognition system. However, the obtained results indicate the need to design a special ASR system with individual requirements due to the specifics of the speech. Subsequently, several methods for adjusting acoustic data are proposed to increase recognition accuracy. The elongation of voiceless phonemes proved to be the most effective, so the developed ASR system was extended by a module taking into account this elongation. The work describes a considerable number of experiments, which were conducted to verify partial hypotheses.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Disertační práce / Dissertations (KKY)

Files in This Item:
File Description SizeFormat 
stanislav-thesis_online.pdfPlný text práce6,97 MBAdobe PDFView/Open
posudky-odp-stanislav.pdfPosudek oponenta práce532,38 kBAdobe PDFView/Open
protokol-odp-stanislav.pdfPrůběh obhajoby práce609,59 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/41889

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.