Benefit of proper language processing for czech speech retrieval in the CL-SR task at CLEF 2006

Ircing, Pavel; Müller, Luděk

Název:	Benefit of proper language processing for czech speech retrieval in the CL-SR task at CLEF 2006
Další názvy:	Přínos vhodného jazykového předzpracování pro vyhledávání v mluvené češtině v úloze CL-SR na CLEF 2006
Autoři:	Ircing, Pavel Müller, Luděk
Citace zdrojového dokumentu:	IRCING, Pavel; MÜLLER, Luděk. Benefit of proper language processing for czech speech retrieval in the CL-SR task at CLEF 2006. In: Evaluation of multilingual and multi-modal information retrieval. Berlin: Springer, 2007, p. 759-765. (Lectures notes in computer science; 4730). ISBN 978-3-540-74998-1.
Datum vydání:	2007
Nakladatel:	Springer
Typ dokumentu:	článek article
URI:	http://www.kky.zcu.cz/cs/publications/IrcingP_2007_BenefitofProper http://hdl.handle.net/11025/17179
ISBN:	978-3-540-74998-1
Klíčová slova:	vyhledávání řečových dokumentů;zpracování přirozeného jazyka;morfologická analýza
Klíčová slova v dalším jazyce:	spoken document retrieval;natural language processing;morphological analysis
Abstrakt:	Článek popisuje systém vytvořený týmem Západočeské univerzity pro účely participace v kampani CLEF 2006 CL-SR track. Rozhodli jsme se soustředit pouze na prohledávání české testovací kolekce a prozkoumání přínosu vhodného jazykového předzpracování pro úspěšnost vyhledávání. Pro účely lingvistického předzpracování dat jsme použili morfologický analyzátor a tagger. Pro vlastní vyhledávání jsme využili klasický tf.idf přístup se slepou zpětnou vazbou tak, jak je implementován v systému Lemur. Výsledky naznačují, že vhodné lingvistické předzpracování je pro úspěšné vyhledávání v mluvené češtině vskutku klíčové.
Abstrakt v dalším jazyce:	The paper describes the system built by the team from the University of West Bohemia for participation in the CLEF 2006 CL-SR track. We have decided to concentrate only on the monolingual searching in the Czech test collection and investigate the effect of proper language processing on the retrieval performance. We have employed the Czech morphological analyser and tagger for that purposes. For the actual search system, we have used the classical tf.idf approach with blind relevance feedback as implemented in the Lemur toolkit. The results indicate that a suitable linguistic preprocessing is indeed crucial for the Czech IR performance.
Práva:	© Pavel Ircing - Luděk Müller
Vyskytuje se v kolekcích:	Články / Articles (KKY)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
IrcingP_2007_BenefitofProper.pdf	Plný text	77,97 kB	Adobe PDF	Zobrazit/otevřít

Zobrazit celý záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/17179

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace