Title: Neuronové sítě pro klasifikaci audio signálu
Other Titles: Neural networks for audio signal classification
Authors: Stránský, Martin
Advisor: Švec Jan, Ing. Ph.D.
Referee: Šmídl Luboš, Ing. Ph.D.
Issue Date: 2022
Publisher: Západočeská univerzita v Plzni
Document type: bakalářská práce
URI: http://hdl.handle.net/11025/50156
Keywords: wav2vec2.0;transformer;automatické rozpoznávání řeči;neuronové sítě;transkripce textu;transfer learning.
Keywords in different language: wav2vec2.0;ctc;transformers;automatic speech recognition;neural networks;text transcription;transfer learning
Abstract: Tématem bakalářské práce je seznámení se a následná aplikace neuronových sítí v oblasti audiosignálů. Jejím obsahem je problematika využití dostupných architektur neuronových sítí ve spojitosti s audiosignály a jejich popis. Následně je popsána úloha, jejímž cílem bylo zjistit dopad využití různých druhů textové reprezentace anotace (ortografické versus normované) trénovacích audionahrávek pro dotrénování předtrénovaného modelu. Model je následně otestován na testovacím balíku dat a jsou vyhodnoceny důsledky zvoleného trénovacího postupu na jeho výslednou přesnost, diskutován je i dopad dodatečné úpravy výstupu modelu na celkový výsledek. Bylo provedeno několik experimentů, jejichž výsledky jsou následně okomentovány a vyhodnoceny. Na získaných výsledcích je zformulována hypotéza o možnostech využití různých forem dat v závislosti na jejich dostupnosti.
Abstract in different language: The aim of this thesis is to cover both the necessary fundamentals of the neural networks and how can they can be used in the real application in the field of audio signal processing. In the first part, the fundamentals of deep learning are covered, the terms explained and the development of selected neural network models and architectures briefly described, pointing out some of the caveats of the not-state-of-the-arts methods as these have led to the currently used methods. The significance of the current extensive development in the whole field of machine learning, mainly the emergence of transfer learning, the shift of the paradigm it means and possible social consequences are also stressed. The fundamentals provided are then used to explain the currently developed tools and lastly exploited in a real task. The following part describes the pre-trained model used which served as the basis for the fine-tuning process for the selected task and evaluates the results obtained though this process. In the conclusion a hypothesis about possible approaches varying on the available annotated data in order to obtain best results in similar applications is formulated upon these results.
Rights: Plný text práce je přístupný bez omezení
Appears in Collections:Bakalářské práce / Bachelor´s works (KKY)

Files in This Item:
File Description SizeFormat 
BP_portal.pdfPlný text práce1,87 MBAdobe PDFView/Open
Stransky_V.pdfPosudek vedoucího práce919,1 kBAdobe PDFView/Open
Stransky_O.pdfPosudek oponenta práce641,77 kBAdobe PDFView/Open
Stransky_P.pdfPrůběh obhajoby práce202,17 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/50156

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.