Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorCampr, Pavel
dc.contributor.authorPražák, Aleš
dc.contributor.authorPsutka, Josef V.
dc.contributor.authorPsutka, Josef
dc.date.accessioned2016-01-11T05:33:20Z
dc.date.available2016-01-11T05:33:20Z
dc.date.issued2013
dc.identifier.citationCAMPR, Pavel; PRAŽÁK, Aleš; PSUTKA, Josef V.; PSUTKA, Josef. Online speaker adaptation of an acoustic model using face recognition. In: Text, speech and dialogue. Berlin: Springer, 2013, p. 378-385. (Lectures notes in computer science; 8082). ISBN 978-3-642-40584-6.en
dc.identifier.isbn978-3-642-40584-6
dc.identifier.urihttp://www.kky.zcu.cz/cs/publications/CamprPavel_2013_OnlineSpeaker
dc.identifier.urihttp://hdl.handle.net/11025/17203
dc.format8 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherSpringeren
dc.relation.ispartofseriesLecture notes in computer science; 8082en
dc.rights© Pavel Campr - Aleš Pražák - Josef V. Psutka - Josef Psutkacs
dc.subjectakustický modelcs
dc.subjectadaptace na řečníkacs
dc.subjectrozpoznávání obličejecs
dc.subjectmultimodální zpracovánícs
dc.subjectautomatické rozpoznávání řečics
dc.titleOnline speaker adaptation of an acoustic model using face recognitionen
dc.title.alternativeOnline adaptace akustického modelu na řečníka s využitím systému pro rozpoznávání obličejůcs
dc.typečlánekcs
dc.typearticleen
dc.rights.accessopenAccessen
dc.type.versionpublishedVersionen
dc.description.abstract-translatedWe have proposed and evaluated a novel approach for online speaker adaptation of an acoustic model based on face recognition. Instead of traditionally used audio-based speaker identification we investigated the video modality for the task of speaker detection. A simulated on-line transcription created by a Large-Vocabulary Continuous Speech Recognition (LVCSR) system for online subtitling is evaluated utilizing speaker independent acoustic models, gender dependent models and models of particular speakers. In the experiment, the speaker dependent acoustic models were trained offline, and are switched online based on the decision of a face recognizer, which reducedWord Error Rate (WER) by 12% relatively compared to speaker independent baseline system.en
dc.subject.translatedacoustic modelen
dc.subject.translatedspeaker adaptationen
dc.subject.translatedface recognitionen
dc.subject.translatedmultimodal processingen
dc.subject.translatedautomatic speech recognitionen
dc.identifier.doi10.1007/978-3-642-40585-3_48
dc.identifier.doi10.1007/978-3-642-40585-3_48
dc.type.statusPeer-revieweden
Vyskytuje se v kolekcích:Články / Articles (NTIS)
Články / Articles (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
CamprPavel_2013_OnlineSpeaker.pdfPlný text264,95 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/17203

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.