Název: Detekce hudby a řeči v rozhlasových nahrávkách
Další názvy: Music and speech detection in radio recordings
Autoři: Müller, Luděk
Vedoucí práce/školitel: Zelinka Jan, Ing. PhD.
Oponent: Tychtl Zbyněk, Ing. Ph.D.
Datum vydání: 2022
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/50246
Klíčová slova: wav2vec;transformer;inaspeechsegmenter;cnn;reciver operating charakteristic
Klíčová slova v dalším jazyce: wav2vec;transformer;inaspeechsegmenter;cnn;reciver operating charakteristic
Abstrakt: Cílem této práce je navrhnout a experimentálně odzkoušet novou metodu detekce řečových a neřečových částí rozhlasového vysílání, jež by měla přispět k úspěšnému vyřešení úlohy automatického určení začátků a konců rozhlasových pořadů za účelem jejich bezproblémového vystavování na internetovém portále mujRozhlas.cz. Je prezentováno stávající řešení, které je v současné době používané. Dále jsou v práci popsány nejvíce slibné metody založené na konvolučních neurono vých sítích a state-of-the-art metodách využívajících transformery a wav2vec framework. Výsledkem práce je pak kromě vytvoření sady datasetů a skriptů pro po rovnání jednotlivých metod především navržení a realizace nového detektoru splňujícího podmínky kladené na jeho implementaci pro řešení úlohy automa tické detekce začátků a konců pořadů v Českém rozhlase
Abstrakt v dalším jazyce: This thesis aims to design and experimentally test a new optimal method of a voice-activity-detector, which should add successfully solve the task of automatically determining the beginnings and ends of radio broadcasts programs for the purpose of their seamless display on the internet portal mujRozhlas.cz An existing solution that is currently in use is presented. The work also describes the most promising methods based on convolutional neural networks and state-of-the-art methods using transformers and the wav2vec framework. The primary result of this work is the design of a new detector meeting the conditions set for its implementation to solve the task of automatic detection of the beginnings and ends of programs on the Czech Radio, as well as the creation of a set of datasets and scripts for comparing individual methods.
Práva: Plný text práce je přístupný bez omezení
Vyskytuje se v kolekcích:Diplomové práce / Theses (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
Diplomova_prace_LM2022_ZCU.pdfPlný text práce6,24 MBAdobe PDFZobrazit/otevřít
Muller_V.pdfPosudek vedoucího práce700,46 kBAdobe PDFZobrazit/otevřít
Muller_O.pdfPosudek oponenta práce1,4 MBAdobe PDFZobrazit/otevřít
Muller_P.pdfPrůběh obhajoby práce266,57 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/50246

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.