Název: | UWB-NTIS Speaker Diarization System for the DIHARD II 2019 Challenge |
Další názvy: | UWB-NTIS diarizační systém pro soutěž DIHARD II 2019 |
Autoři: | Zajíc, Zbyněk Kunešová, Marie Hrúz, Marek Vaněk, Jan |
Citace zdrojového dokumentu: | ZAJÍC, Z., KUNEŠOVÁ, M., HRÚZ, M., VANĚK, J. UWB-NTIS Speaker Diarization System for the DIHARD II 2019 Challenge. In: Proceedings of the 20th Annual Conference of the International Speech Communication Association (Interspeech 2019). Red Hook, NY: Curran Associates, Inc., 2019. s. 993-997. ISBN 978-1-5108-9683-3 , ISSN 2308-457X. |
Datum vydání: | 2019 |
Nakladatel: | Curran Associates, Inc. |
Typ dokumentu: | konferenční příspěvek conferenceObject |
URI: | 2-s2.0-85071443189 http://hdl.handle.net/11025/36666 |
ISBN: | 978-1-5108-9683-3 |
ISSN: | 2308-457X |
Klíčová slova: | diarizace, i-vector, x-vector, agglomerativní shlukování, neuronové sítě, detekce změny řečníka |
Klíčová slova v dalším jazyce: | speaker diarization, i-vector, x-vector, agglomerative hierarchical clustering, neural network classifier, speaker change detection |
Abstrakt: | V tomto článku je prezentován systém vyvíjený týmem NTIS za účelem evaluace na soutěži DIHARD II. Základem systému je standartní přístup k diarizaci založený na segmentaci, i/x-vektorové extrakci, shlukování a resegmentaci. Hyperparametry pro každý ze subsystémů byly zvoleny ohledem na klasifikátor domény trénovaný na development setu pro DIHARD II. Náš systém jsme v článku porovnaly se systémem Kaldi a vyhodnotili též kombinaci těchto dvou systémů. Výsledky v době tohoto psaní abstraktu jsou: DER 23.47% a JER 48.99%. In this paper, we present our system developed by the team from the New Technologies for the Information Society (NTIS) research center of the University of West Bohemia in Pilsen, for the Second DIHARD Speech Diarization Challenge. The base of our system follows the currently-standard approach of segmentation, i/x-vector extraction, clustering, and resegmentation. The hyperparameters for each of the subsystems were selected according to the domain classifier trained on the development set of DIHARD II. We compared our system with results from the Kaldi diarization (with i/x-vectors) and combined these systems. At the time of writing of this abstract, our best submission achieved a DER of 23.47% and a JER of 48.99% on the evaluation set (in Track 1 using reference SAD). |
Práva: | Plný text je přístupný v rámci univerzity přihlášeným uživatelům. © Curran Associates, Inc. |
Vyskytuje se v kolekcích: | Konferenční příspěvky / Conference Papers (KKY) OBD |
Soubory připojené k záznamu:
Soubor | Velikost | Formát | |
---|---|---|---|
1385_zajic_kunesova_hruz_vanek.pdf | 220,61 kB | Adobe PDF | Zobrazit/otevřít Vyžádat kopii |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/36666
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.