Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorLehečka, Jan
dc.date.accepted2019-6-24
dc.date.accessioned2020-07-17T13:44:44Z-
dc.date.available2018-11-19
dc.date.available2020-07-17T13:44:44Z-
dc.date.issued2019
dc.date.submitted2019-3-22
dc.identifier80461
dc.identifier.urihttp://hdl.handle.net/11025/37781
dc.description.abstractTato disertační práce se zabývá adaptací jazykového modelu na téma v reálném čase. Jde o mechanismus navržený pro snížení chybovosti automatického rozpoznávače řeči v úlohách živého přepisu vícetématických promluv, kde obecný jazykový model není schopen dostatečně popsat rozdílné statistiky posloupností slov v jednotlivých tématech. Základní myšlenka spočívá v dynamickém přizpůsobování jazykového modelu během živého rozpoznávání na základě tématu detekovaném v rozpoznané řeči. Nejprve je shrnut aktuální stav poznání této problematiky doplněný detailním teoretickým základem pro použité metody a modely. Popsané metody zpravidla kombinují dvě významné výzkumné oblasti: automatické rozpoznávání řeči v reálném čase a automatickou identifikaci tématu. Poté je navrženo inovativní rozšíření existujícího automatického rozpoznávače řeči o adaptaci jazykového modelu na téma v reálném čase. Originalita navrženého řešení spočívá především v minimalizaci prodlevy adaptace na téma díky paralelnímu běhu dvou dekodérů (obecného a tématického) zároveň a následnému spojení obou výstupů, což vede ke snížení chybovosti slov při živém rozpoznávání řeči. Navržený adaptabilní systém byl implementován a otestován na dvou vícetématických problémech: živý přepis televizního zpravodajství a živý přepis televizních sportovních přehledů. Experimenty v této práci v obou případech prokázaly, že navržený systém pracuje významně lépe než neadaptabilní systém a že adaptace jazykového modelu na téma snižuje chybovost živých přepisů, zejména pak vlastních jmen úzce spjatých s jednotlivými tématy.cs
dc.formatix, 124cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.subjectautomatické rozpoznávání řečics
dc.subjectadaptace jazykového modelucs
dc.subjectidentifikace tématucs
dc.subjectživý přepis tv pořadůcs
dc.subjectrozpoznávání řeči v reálném časecs
dc.titleAdaptace jazykového modelu na téma v reálném časecs
dc.title.alternativeOnline Topic-based Language Model Adaptationen
dc.typedisertační prácecs
dc.thesis.degree-namePh.D.cs
dc.thesis.degree-levelDoktorskýcs
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-programAplikované vědy a informatikacs
dc.description.resultObhájenocs
dc.rights.accessopenAccessen
dc.description.abstract-translatedThe research area of this thesis is online topic-based language model (LM) adaptation. It is a mechanism designed to reduce word error rates of real-time automatic speech recognition (ASR) systems in multi-topic tasks, where a general LM cannot model varying word sequence statistics in particular topics appropriately. The base idea is to dynamically adjust the LM during live decoding based on topics detected in the decoded transcripts. First, the thesis surveys the state of the art of the problem including also detailed theoretical background of used methods and models. Described methods usually combine two very important research areas: real-time automatic speech recognition and automatic topic identification. Next, an innovative solution to extend existing real-time ASR system by online topic-based LM adaptation is proposed and described in details. The originality of proposed solution lies primarily in minimizing latency of the topic-based adaptation by using two parallel decoders (general and topic-specific), and online merging their outcomes in order to reduce word error rate during online speech recognition. The proposed adaptable system was implemented and tested for two multi-topic real-time ASR problems: live transcription of TV news and live transcription of TV sports summaries. For both problems, experiments in this thesis showed that proposed system performs significantly better than a system without LM adaptation, and that topic-based LM adaptation can reduce error rates of live transcripts, especially by better recognizing topic-specific proper nouns.en
dc.title.otherAdaptace jazykového modelu na téma v reálném časecs
dc.subject.translatedautomatic speech recognitionen
dc.subject.translatedlanguage model adaptationen
dc.subject.translatedtopic identificationen
dc.subject.translatedlive tv shows transcriptionen
dc.subject.translatedonline speech recognitionen
Vyskytuje se v kolekcích:Disertační práce / Dissertations (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
Disertace.pdfPlný text práce2,19 MBAdobe PDFZobrazit/otevřít
protokol-odp-lehecka.pdfPrůběh obhajoby práce576,25 kBAdobe PDFZobrazit/otevřít
posudky-odp-lehecka.pdfPosudek oponenta práce2,4 MBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/37781

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.