Title: Vyhledávání v Sémantickém webu použitím přirozeného jazyka
Other Titles: Semantic Web Search Using Natural Language
Authors: Habernal, Ivan
Advisor: Matoušek, Václav
Issue Date: 2012
Publisher: Západočeská univerzita v Plzni
Document type: disertační práce
URI: http://hdl.handle.net/11025/5425
Keywords: rozhraní;sémantické vyhledávání;porozumění;přirozenýjazyk
Keywords in different language: interface;semantic search;natural language;understanding
Abstract: Disertační práce popisuje kompletní systém pro vyhledávání v sémantickém webu použitím přirozeného jazyka. Systém je představen v kontextu výzkumu na poli Information Retrieval, sémantického webu, porozumění přirozenému jazyku a rozhraní využívajících přirozený jazyk. Hlavní výhodou rozhraní využívajících přirozený jazyk je možnost zadat otázku celou větou namísto vyplňování webových formulářů nebo použití pouze klíčových slov. Vyvinutý systém využívá technologie sémantického webu tradičními i novými způsoby. Myšlenka sémantického webu vnesla mnoho zajímavých konceptů do modelování domén a sdílení dat napříč doménami. Navíc kombinace sémantického webu a rozhraní využívajích přirozený jazyk skýtá nové možnosti pro vylepšení uživatelského komfortu při vyhledávání. Disertační práce má tyto hlavní přínosy. Zaprvé: byl navržen nový formalismum pro zachycení sémantiky otázky v přirozeném jazyce. Tento formalismum využívá technologií sémantického webu. Zadruhé: byl vyvinut statistický model pro sémantickou analýzu založený na strojovém učení. Zatřetí: systém byl otestován na reálných datech a reálných otázkách. Systém byl testován na doméně pro vyhledávání ubytování. Data byla získána z reálných webových portálů stejně jako testovací otázky v přirozeném jazyce. Práce se zabývá teoretickými i praktickými problémy, které musí být ve funkčním systému vyřešeny. Je popsán celý postup získání dat, korpus otázek, návrh ontologií, anotace, sémantická analýza a vyhledávání. Na závěr je provedeno velmi důkladné vyhodnocení funkčnosti systému. Pozornost je také zaměřena na otevřené problémy, např. výkon, použitelnost, přenositelnost na jinou doménu a jazyk a zdroje webových dat.
Abstract in different language: This thesis presents a complete end-to-end system for the Semantic Web search using a Natural Language. The system is placed into the context of recent research in Information Retreival, Semantic Web, Natural Language Understanding, and Natural Language Interfaces. The key feature of Natural Language Interfaces is that users can search for the required information by posing their questions using natural language instead of e.g. filling web forms. The developed system uses the Semantic Web technologies in both traditional and new forms. The idea of the Semantic Web has brought many interesting concepts into domain modeling and data sharing. Furthermore, the development in Natural Language Interfaces to Semantic Web has shown that bridging the gap between the Semantic Web and Natural Language Interfaces can uncover new research challenges. The main contributions of this thesis are as follows. First, a unique formalism for capturing a natural language question semantics, based upon Semantic Web standards, was proposed. Second, the statistical model for the semantic analysis based upon supervised training was developed. Third, the evaluation of the fully functional end-to-end system with a real data and real queries was conducted. The system was tested in the accommodation domain using real data acquired from the Web as well as the corpus of real queries in natural language. The thesis deals with both theoretical and practical issues that must be solved in a fully functional system. A~complete work-flow is described, including preparation of data, natural language corpus, ontology design, annotation, semantic model and search. Finally, a~very detailed evaluation with promising results is presented and discussed. Special attention is also paid to open issues, such as a performance, a usability, a portability, or sources of a real Web data.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Disertační práce / Dissertations (KKY)

Files in This Item:
File Description SizeFormat 
habernal-phd-thesis-semantic-web-search-using-natural-language-2012.pdfPlný text práce2,7 MBAdobe PDFView/Open
posudek-skolitel-odp-habernal.pdfPosudek vedoucího práce42,4 kBAdobe PDFView/Open
posudky-odp-habernal.pdfPosudek oponenta práce177,31 kBAdobe PDFView/Open
protokol-odp-habernal.pdfPrůběh obhajoby práce48,22 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/5425

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.