Název: | Investigation of segmentation in i-vector based speaker diarization of telephone speech |
Další názvy: | Segmentace v systému pro diarizaci řečníka založeném na i-vektorech pro telefonní řeč |
Autoři: | Zajíc, Zbyněk Kunešová, Marie Radová, Vlasta |
Citace zdrojového dokumentu: | ZAJÍC, Zbyněk; KUNEŠOVÁ, Marie; RADOVÁ, Vlasta. Investigation of segmentation in i-vector based speaker diarization of telephone speech. In: SPECOM 2016 Proceedings: 18th International Conference on Speech and Computer, 23-27 August 2016, Budapest. Budapest: Moskow state linguistic university, 2016, p. 411-418. ISBN 978-3-319-43957-0 (Print); 978-3-319-43958-7 (Online). |
Datum vydání: | 2016 |
Nakladatel: | Springer |
Typ dokumentu: | konferenční příspěvek conferenceObject |
URI: | http://www.kky.zcu.cz/cs/publications/ZbynekZajic_2016_Investigationof http://hdl.handle.net/11025/25663 |
ISBN: | 978-3-319-43957-0 (Print) 978-3-319-43958-7 (Online) |
Klíčová slova: | diarizace řečníka;detekce změny řečníka;segmentace;i-vektor |
Klíčová slova v dalším jazyce: | speaker diarization;speaker change detection;segmentation;i-vector |
Abstrakt: | Článek se zabývá přínosem detekce změny řečníka (SCD) v úloze diarizace pro telefonní konverzace. Porovnali jsme úspěšnost diarizačního systému založeného na i-vektorech používající naivní segmentaci (konstantní délka okna) a SCD. Experimenty na CallHome korpusu dokázali lepší úspěšnost diarizace s pomocí SCD, ale rozdíly mezi testovanými přístupy byly nakonec smazány použítím resegmentace. |
Abstrakt v dalším jazyce: | The goal of this paper is to evaluate the contribution of speaker change detection (SCD) to the performance of a speaker diarization system in the telephone domain. We compare the overall performance of an i-vector based system using both SCD-based segmentation and a naive constant length segmentation with overlapping segments. The diarization system performs K-means clustering of i-vectors which represent the individual segments, followed by a resegmentation step. Experiments were done on the English part of the CallHome corpus. The final results indicate that the use of speaker change detection is beneficial, but the differences between the two segmentation approaches are diminished by the use of resegmentation. |
Práva: | © Springer International Publishing Switzerland |
Vyskytuje se v kolekcích: | Konferenční příspěvky / Conference Papers (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
Zajic.pdf | Plný text | 404,58 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/25663
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.