Full metadata record
DC poleHodnotaJazyk
dc.contributor.advisorPsutka, Josef
dc.contributor.authorHoidekr, Jan
dc.date.accepted2012-12-20
dc.date.accessioned2015-05-11T09:18:31Z
dc.date.available2004-09-01cs
dc.date.available2015-05-11T09:18:31Z
dc.date.issued2012
dc.date.submitted2012-10-31
dc.identifier52564
dc.identifier.urihttp://hdl.handle.net/11025/5410
dc.description.abstractTato práce se zabývá statickými modely přirozeného jazyka a jejich speciálním druhem jazykovými modely postavené na třídách. Tyto modely se používají v~systémech rozpoznávání řeči. Práce se nezabývá obecným zlepšováním jazykového modelování, ale zaměřuje na oblast specifických skupin slov, které nelze dobře modelovat z~dostupných trénovacích dat. Nedostatečnost dat je limitující faktor pro jazykové modelování současných metod. Přidání slov do systému není triviální problém z důvodu požadavku, aby systém tato slova dokázal rozpoznat, budou-li vyslovena a současně se nezhoršila obecná přesnost rozpoznávání. Jelikož tyto třídy jsou otevřené, vyskytuje se často legitimní potřeba tato slova přidávat do již hotového ASR systému. Toto přidání ovšem není jednoduchá záležitost a často vede ke snížení přesnosti rozpoznávání. Cílem práce je připravit postup rozšíření slovníku systému rozpoznávání řeči a zajistit správné nastavení systému pro správné rozpoznávání těchto slov při současném nezhoršení parametrů celého systému.cs
dc.format92 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.subjectrozpoznávání řečics
dc.subjectjazykové modelovánícs
dc.subjectjazykový model s třídamics
dc.subjectrozšíření slovníkucs
dc.subjectredukce OOVcs
dc.titleMetody redukce OOV ve statistických jazykových modelech založených na třídáchcs
dc.title.alternativeMethods of OOV Reduction in Class-based Statistical Language Modelsen
dc.typedisertační prácecs
dc.thesis.degree-namePh.D.cs
dc.thesis.degree-levelDoktorskýcs
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.description.departmentKatedra kybernetikycs
dc.thesis.degree-programAplikované vědy a informatikacs
dc.description.resultObhájenocs
dc.rights.accessopenAccessen
dc.description.abstract-translatedThis thesis aims at research into the static natural language models, especially the language models build on word classes. Such language models are (widely, commonly) used in automatic speech recognition systems. This work doesn't aim at general research into improving the aforementioned language models. Instead, the focus of the thesis is laid on specific word classes(, i.e. specific set of words syntactically or semantically similar). The words from these classes cannot be modeled reliably from the training data. The main obstacle here is the insufficient amount of training data. Since these classes are open, there is often legitimate need to introduce these words into an already existing ASR system. This is not an simple task, however, and often hurts the ASR system recognition accuracy.The purpose of the research was to develop an approach for augmenting the vocabulary of an ASR system and to determine the correct settings of the ASR system resulting in correct recognition of the problematic word classes, while the recognition accuracy remains the same.en
dc.subject.translatedspeech recognitionen
dc.subject.translatedlanguage modellingen
dc.subject.translatedclass-based language modelen
dc.subject.translatedextension vocabularyen
dc.subject.translatedOOV reductionen
Vyskytuje se v kolekcích:Disertační práce / Dissertations (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
Dis-Hoidekr.pdfPlný text práce652,88 kBAdobe PDFZobrazit/otevřít
posudek-skolitel-odp-hoidekr.pdfPosudek vedoucího práce37,42 kBAdobe PDFZobrazit/otevřít
posudky-odp-hoidekr.pdfPosudek oponenta práce155,03 kBAdobe PDFZobrazit/otevřít
protokol-odp-hoidekr.pdfPrůběh obhajoby práce54,4 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/5410

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.