Title: Detekce hudby a řeči v rozhlasových nahrávkách
Other Titles: Music and speech detection in radio recordings
Authors: Müller, Luděk
Advisor: Zelinka Jan, Ing. PhD.
Referee: Tychtl Zbyněk, Ing. Ph.D.
Issue Date: 2022
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/50246
Keywords: wav2vec;transformer;inaspeechsegmenter;cnn;reciver operating charakteristic
Keywords in different language: wav2vec;transformer;inaspeechsegmenter;cnn;reciver operating charakteristic
Abstract: Cílem této práce je navrhnout a experimentálně odzkoušet novou metodu detekce řečových a neřečových částí rozhlasového vysílání, jež by měla přispět k úspěšnému vyřešení úlohy automatického určení začátků a konců rozhlasových pořadů za účelem jejich bezproblémového vystavování na internetovém portále mujRozhlas.cz. Je prezentováno stávající řešení, které je v současné době používané. Dále jsou v práci popsány nejvíce slibné metody založené na konvolučních neurono vých sítích a state-of-the-art metodách využívajících transformery a wav2vec framework. Výsledkem práce je pak kromě vytvoření sady datasetů a skriptů pro po rovnání jednotlivých metod především navržení a realizace nového detektoru splňujícího podmínky kladené na jeho implementaci pro řešení úlohy automa tické detekce začátků a konců pořadů v Českém rozhlase
Abstract in different language: This thesis aims to design and experimentally test a new optimal method of a voice-activity-detector, which should add successfully solve the task of automatically determining the beginnings and ends of radio broadcasts programs for the purpose of their seamless display on the internet portal mujRozhlas.cz An existing solution that is currently in use is presented. The work also describes the most promising methods based on convolutional neural networks and state-of-the-art methods using transformers and the wav2vec framework. The primary result of this work is the design of a new detector meeting the conditions set for its implementation to solve the task of automatic detection of the beginnings and ends of programs on the Czech Radio, as well as the creation of a set of datasets and scripts for comparing individual methods.
Rights: Plný text práce je přístupný bez omezení
Appears in Collections:Diplomové práce / Theses (KKY)

Files in This Item:
File Description SizeFormat 
Diplomova_prace_LM2022_ZCU.pdfPlný text práce6,24 MBAdobe PDFView/Open
Muller_V.pdfPosudek vedoucího práce700,46 kBAdobe PDFView/Open
Muller_O.pdfPosudek oponenta práce1,4 MBAdobe PDFView/Open
Muller_P.pdfPrůběh obhajoby práce266,57 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/50246

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.