Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorKunešová, Marie
dc.date.accepted2021-12-1
dc.date.accessioned2023-06-13T07:57:11Z-
dc.date.available2021-6-1
dc.date.available2023-06-13T07:57:11Z-
dc.date.issued2021
dc.date.submitted2021-6-25
dc.identifier88139
dc.identifier.urihttp://hdl.handle.net/11025/52936-
dc.description.abstractDisertační práce se zaměřuje na téma diarizace řečníků, což je úloha zpracování řeči typicky charakterizovaná otázkou "Kdo kdy mluví?". Práce se také zabývá související úlohou detekce překrývající se řeči, která je velmi relevantní pro diarizaci. Teoretická část práce poskytuje přehled existujících metod diarizace řečníků, a to jak těch offline, tak online, a přibližuje několik problematických oblastí, které byly identifikovány v rané fázi autorčina výzkumu. V práci je také předloženo rozsáhlé srovnání existujících systémů se zaměřením na jejich uváděné výsledky. Jedna kapitola se také zaměřuje na téma překrývající se řeči a na metody její detekce. Experimentální část práce předkládá praktické výstupy, kterých bylo dosaženo. Experimenty s diarizací se zaměřovaly zejména na online systém založený na GMM a na i-vektorový systém, který měl offline i online varianty. Závěrečná sekce experimentů také přibližuje nově navrženou metodu pro detekci překrývající se řeči, která je založena na konvoluční neuronové síti.cs
dc.format147
dc.language.isoen
dc.publisherZápadočeská univerzita v Plzni
dc.rightsPlný text práce je přístupný bez omezení
dc.subjectdiarizace řečníkůcs
dc.subjectdetekce překrývající se řečics
dc.subjectzpracování mluvené řečics
dc.titleSpeaker Diarizationcs
dc.title.alternativeSpeaker Diarizationen
dc.typedisertační práce
dc.thesis.degree-namePh.D.
dc.thesis.degree-levelDoktorský
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-programAplikované vědy a informatika
dc.description.resultObhájeno
dc.description.abstract-translatedThe thesis focuses on the topic of speaker diarization, a speech processing task that is commonly characterized as the question "Who speaks when?". It also addresses the related task of overlapping speech detection, which is very relevant for diarization. The theoretical part of the thesis provides an overview of existing diarization approaches, both offline and online, and discusses some of the problematic areas which were identified in early stages of the author's research. The thesis also includes an extensive comparison of existing diarization systems, with focus on their reported performance. One chapter is also dedicated to the topic of overlapping speech and the methods of its detection. The experimental part of the thesis then presents the work which has been done on speaker diarization, which was focused mostly on a GMM-based online diarization system and an i-vector based system with both offline and online variants. The final section also details a newly proposed approach for detecting overlapping speech using a convolutional neural network.en
dc.subject.translatedspeaker diarizationen
dc.subject.translatedoverlapping speech detectionen
dc.subject.translatedspeech processingen
Vyskytuje se v kolekcích:Disertační práce / Dissertations (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
Disertace_MarieKunesova.pdfPlný text práce2,57 MBAdobe PDFZobrazit/otevřít
posudky-odp-kunesova.pdfPosudek oponenta práce265,92 kBAdobe PDFZobrazit/otevřít
protokol-odp-kunesova.pdfPrůběh obhajoby práce286,97 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/52936

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.