Název: Vícejazyčné vyhledávání v textových dokumentech
Další názvy: Multilingual text document retrieval
Autoři: Matura, Ondřej
Vedoucí práce/školitel: Lenc Ladislav, Ing. Ph.D.
Oponent: Král Pavel, Doc. Ing. Ph.D.
Datum vydání: 2023
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: bakalářská práce
URI: http://hdl.handle.net/11025/53763
Klíčová slova: clir;nlp;bert model;slovní vektory
Klíčová slova v dalším jazyce: clir;nlp;bert model;word embeddings
Abstrakt: Tato bakalářská práce zkoumá potenciál pro zlepšení vícejazyčného vyhledávání informací (CLIR) v rámci portálu Porta fontium, který poskytuje přístup k historickým materiálům z Česko-Bavorského pohraničí. Je tedy důležité umožnit vyhledávání v českých i německých dokumentech zároveň. Práce nejprve poskytuje přehled metod CLIR, zahrnující jak tradiční, tak moderní přístupy. Tato analýza zdůrazňuje silné a slabé stránky každé metody, čímž připravuje cestu pro návrh řešení. Poté studie zkoumá dostupné CLIR datasety a hodnotící metriky. Následně jsou provedeny experimenty pro vyhodnocení výkonnosti vybraných CLIR metod s využitím identifikovaných datasetů a metrik. Tato analýza směřuje k vývoji softwarového modulu CLIR, který bude možné použít v systému Porta fontium.
Abstrakt v dalším jazyce: This bachelor's thesis investigates the potential for improving cross-language information retrieval (CLIR) within the Porta fontium portal, which provides access to historical materials from the Czech-Bavarian border region. It is therefore important to enable simultaneous search in both Czech and German documents. The thesis first provides an overview of CLIR methods, including both traditional and modern approaches. This analysis highlights the strengths and weaknesses of each method, paving the way for a solution proposal. Afterwards, the study examines available CLIR datasets and evaluation metrics. Experiments are then conducted to evaluate the performance of selected CLIR methods, using the identified datasets and metrics. This analysis leads to the development of a CLIR software module that can be integrated into the Porta fontium system.
Práva: Plný text práce je přístupný bez omezení
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
Vicejazycne vyhledavani v textovych dokumentech.pdfPlný text práce606,07 kBAdobe PDFZobrazit/otevřít
A19B0135P_Hodnoceni.pdfPosudek vedoucího práce98,94 kBAdobe PDFZobrazit/otevřít
A19B0135P_Posudek.pdfPosudek oponenta práce23,66 kBAdobe PDFZobrazit/otevřít
A19B0135P_Obhajoba.pdfPrůběh obhajoby práce42,34 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/53763

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.