Full metadata record
DC poleHodnotaJazyk
dc.contributor.advisorŠvec Jan, Ing. Ph.D.
dc.contributor.authorStránský, Martin
dc.contributor.refereeŠmídl Luboš, Ing. Ph.D.
dc.date.accepted2022-8-30
dc.date.accessioned2022-11-10T14:45:49Z-
dc.date.available2022-2-15
dc.date.available2022-11-10T14:45:49Z-
dc.date.issued2022
dc.date.submitted2022-8-15
dc.identifier90967
dc.identifier.urihttp://hdl.handle.net/11025/50156-
dc.description.abstractTématem bakalářské práce je seznámení se a následná aplikace neuronových sítí v oblasti audiosignálů. Jejím obsahem je problematika využití dostupných architektur neuronových sítí ve spojitosti s audiosignály a jejich popis. Následně je popsána úloha, jejímž cílem bylo zjistit dopad využití různých druhů textové reprezentace anotace (ortografické versus normované) trénovacích audionahrávek pro dotrénování předtrénovaného modelu. Model je následně otestován na testovacím balíku dat a jsou vyhodnoceny důsledky zvoleného trénovacího postupu na jeho výslednou přesnost, diskutován je i dopad dodatečné úpravy výstupu modelu na celkový výsledek. Bylo provedeno několik experimentů, jejichž výsledky jsou následně okomentovány a vyhodnoceny. Na získaných výsledcích je zformulována hypotéza o možnostech využití různých forem dat v závislosti na jejich dostupnosti.cs
dc.format65
dc.language.isocs
dc.publisherZápadočeská univerzita v Plzni
dc.relation.isreferencedbyhttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=90967-
dc.rightsPlný text práce je přístupný bez omezení
dc.subjectwav2vec2.0cs
dc.subjecttransformercs
dc.subjectautomatické rozpoznávání řečics
dc.subjectneuronové sítěcs
dc.subjecttranskripce textucs
dc.subjecttransfer learning.cs
dc.titleNeuronové sítě pro klasifikaci audio signálucs
dc.title.alternativeNeural networks for audio signal classificationen
dc.typebakalářská práce
dc.thesis.degree-nameBc.
dc.thesis.degree-levelBakalářský
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-programAplikované vědy a informatika
dc.description.resultObhájeno
dc.description.abstract-translatedThe aim of this thesis is to cover both the necessary fundamentals of the neural networks and how can they can be used in the real application in the field of audio signal processing. In the first part, the fundamentals of deep learning are covered, the terms explained and the development of selected neural network models and architectures briefly described, pointing out some of the caveats of the not-state-of-the-arts methods as these have led to the currently used methods. The significance of the current extensive development in the whole field of machine learning, mainly the emergence of transfer learning, the shift of the paradigm it means and possible social consequences are also stressed. The fundamentals provided are then used to explain the currently developed tools and lastly exploited in a real task. The following part describes the pre-trained model used which served as the basis for the fine-tuning process for the selected task and evaluates the results obtained though this process. In the conclusion a hypothesis about possible approaches varying on the available annotated data in order to obtain best results in similar applications is formulated upon these results.en
dc.subject.translatedwav2vec2.0en
dc.subject.translatedctcen
dc.subject.translatedtransformersen
dc.subject.translatedautomatic speech recognitionen
dc.subject.translatedneural networksen
dc.subject.translatedtext transcriptionen
dc.subject.translatedtransfer learningen
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
BP_portal.pdfPlný text práce1,87 MBAdobe PDFZobrazit/otevřít
Stransky_V.pdfPosudek vedoucího práce919,1 kBAdobe PDFZobrazit/otevřít
Stransky_O.pdfPosudek oponenta práce641,77 kBAdobe PDFZobrazit/otevřít
Stransky_P.pdfPrůběh obhajoby práce202,17 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/50156

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.