Adaptace jazykového modelu na téma v reálném čase

Lehečka, Jan

Full metadata record

DC pole	Hodnota	Jazyk
dc.contributor.author	Lehečka, Jan
dc.date.accepted	2019-6-24
dc.date.accessioned	2020-07-17T13:44:44Z	-
dc.date.available	2018-11-19
dc.date.available	2020-07-17T13:44:44Z	-
dc.date.issued	2019
dc.date.submitted	2019-3-22
dc.identifier	80461
dc.identifier.uri	http://hdl.handle.net/11025/37781
dc.description.abstract	Tato disertační práce se zabývá adaptací jazykového modelu na téma v reálném čase. Jde o mechanismus navržený pro snížení chybovosti automatického rozpoznávače řeči v úlohách živého přepisu vícetématických promluv, kde obecný jazykový model není schopen dostatečně popsat rozdílné statistiky posloupností slov v jednotlivých tématech. Základní myšlenka spočívá v dynamickém přizpůsobování jazykového modelu během živého rozpoznávání na základě tématu detekovaném v rozpoznané řeči. Nejprve je shrnut aktuální stav poznání této problematiky doplněný detailním teoretickým základem pro použité metody a modely. Popsané metody zpravidla kombinují dvě významné výzkumné oblasti: automatické rozpoznávání řeči v reálném čase a automatickou identifikaci tématu. Poté je navrženo inovativní rozšíření existujícího automatického rozpoznávače řeči o adaptaci jazykového modelu na téma v reálném čase. Originalita navrženého řešení spočívá především v minimalizaci prodlevy adaptace na téma díky paralelnímu běhu dvou dekodérů (obecného a tématického) zároveň a následnému spojení obou výstupů, což vede ke snížení chybovosti slov při živém rozpoznávání řeči. Navržený adaptabilní systém byl implementován a otestován na dvou vícetématických problémech: živý přepis televizního zpravodajství a živý přepis televizních sportovních přehledů. Experimenty v této práci v obou případech prokázaly, že navržený systém pracuje významně lépe než neadaptabilní systém a že adaptace jazykového modelu na téma snižuje chybovost živých přepisů, zejména pak vlastních jmen úzce spjatých s jednotlivými tématy.	cs
dc.format	ix, 124	cs
dc.format.mimetype	application/pdf
dc.language.iso	en	en
dc.publisher	Západočeská univerzita v Plzni	cs
dc.relation.isreferencedby	https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=80461	-
dc.rights	Plný text práce je přístupný bez omezení.	cs
dc.subject	automatické rozpoznávání řeči	cs
dc.subject	adaptace jazykového modelu	cs
dc.subject	identifikace tématu	cs
dc.subject	živý přepis tv pořadů	cs
dc.subject	rozpoznávání řeči v reálném čase	cs
dc.title	Adaptace jazykového modelu na téma v reálném čase	cs
dc.title.alternative	Online Topic-based Language Model Adaptation	en
dc.type	disertační práce	cs
dc.thesis.degree-name	Ph.D.	cs
dc.thesis.degree-level	Doktorský	cs
dc.thesis.degree-grantor	Západočeská univerzita v Plzni. Fakulta aplikovaných věd	cs
dc.thesis.degree-program	Aplikované vědy a informatika	cs
dc.description.result	Obhájeno	cs
dc.rights.access	openAccess	en
dc.description.abstract-translated	The research area of this thesis is online topic-based language model (LM) adaptation. It is a mechanism designed to reduce word error rates of real-time automatic speech recognition (ASR) systems in multi-topic tasks, where a general LM cannot model varying word sequence statistics in particular topics appropriately. The base idea is to dynamically adjust the LM during live decoding based on topics detected in the decoded transcripts. First, the thesis surveys the state of the art of the problem including also detailed theoretical background of used methods and models. Described methods usually combine two very important research areas: real-time automatic speech recognition and automatic topic identification. Next, an innovative solution to extend existing real-time ASR system by online topic-based LM adaptation is proposed and described in details. The originality of proposed solution lies primarily in minimizing latency of the topic-based adaptation by using two parallel decoders (general and topic-specific), and online merging their outcomes in order to reduce word error rate during online speech recognition. The proposed adaptable system was implemented and tested for two multi-topic real-time ASR problems: live transcription of TV news and live transcription of TV sports summaries. For both problems, experiments in this thesis showed that proposed system performs significantly better than a system without LM adaptation, and that topic-based LM adaptation can reduce error rates of live transcripts, especially by better recognizing topic-specific proper nouns.	en
dc.title.other	Adaptace jazykového modelu na téma v reálném čase	cs
dc.subject.translated	automatic speech recognition	en
dc.subject.translated	language model adaptation	en
dc.subject.translated	topic identification	en
dc.subject.translated	live tv shows transcription	en
dc.subject.translated	online speech recognition	en
Vyskytuje se v kolekcích:	Disertační práce / Dissertations (KKY)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
Disertace.pdf	Plný text práce	2,19 MB	Adobe PDF	Zobrazit/otevřít
protokol-odp-lehecka.pdf	Průběh obhajoby práce	576,25 kB	Adobe PDF	Zobrazit/otevřít
posudky-odp-lehecka.pdf	Posudek oponenta práce	2,4 MB	Adobe PDF	Zobrazit/otevřít

Zobrazit minimální záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/37781

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace