Title: Speaker Diarization
Other Titles: Speaker Diarization
Authors: Kunešová, Marie
Issue Date: 2021
Publisher: Západočeská univerzita v Plzni
Document type: disertační práce
URI: http://hdl.handle.net/11025/52936
Keywords: diarizace řečníků;detekce překrývající se řeči;zpracování mluvené řeči
Keywords in different language: speaker diarization;overlapping speech detection;speech processing
Abstract: Disertační práce se zaměřuje na téma diarizace řečníků, což je úloha zpracování řeči typicky charakterizovaná otázkou "Kdo kdy mluví?". Práce se také zabývá související úlohou detekce překrývající se řeči, která je velmi relevantní pro diarizaci. Teoretická část práce poskytuje přehled existujících metod diarizace řečníků, a to jak těch offline, tak online, a přibližuje několik problematických oblastí, které byly identifikovány v rané fázi autorčina výzkumu. V práci je také předloženo rozsáhlé srovnání existujících systémů se zaměřením na jejich uváděné výsledky. Jedna kapitola se také zaměřuje na téma překrývající se řeči a na metody její detekce. Experimentální část práce předkládá praktické výstupy, kterých bylo dosaženo. Experimenty s diarizací se zaměřovaly zejména na online systém založený na GMM a na i-vektorový systém, který měl offline i online varianty. Závěrečná sekce experimentů také přibližuje nově navrženou metodu pro detekci překrývající se řeči, která je založena na konvoluční neuronové síti.
Abstract in different language: The thesis focuses on the topic of speaker diarization, a speech processing task that is commonly characterized as the question "Who speaks when?". It also addresses the related task of overlapping speech detection, which is very relevant for diarization. The theoretical part of the thesis provides an overview of existing diarization approaches, both offline and online, and discusses some of the problematic areas which were identified in early stages of the author's research. The thesis also includes an extensive comparison of existing diarization systems, with focus on their reported performance. One chapter is also dedicated to the topic of overlapping speech and the methods of its detection. The experimental part of the thesis then presents the work which has been done on speaker diarization, which was focused mostly on a GMM-based online diarization system and an i-vector based system with both offline and online variants. The final section also details a newly proposed approach for detecting overlapping speech using a convolutional neural network.
Rights: Plný text práce je přístupný bez omezení
Appears in Collections:Disertační práce / Dissertations (KKY)

Files in This Item:
File Description SizeFormat 
Disertace_MarieKunesova.pdfPlný text práce2,57 MBAdobe PDFView/Open
posudky-odp-kunesova.pdfPosudek oponenta práce265,92 kBAdobe PDFView/Open
protokol-odp-kunesova.pdfPrůběh obhajoby práce286,97 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/52936

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.