Full metadata record
DC pole | Hodnota | Jazyk |
---|---|---|
dc.contributor.advisor | Brychcín Tomáš, Ing. Ph.D. | |
dc.contributor.author | Mištera, Adam | |
dc.contributor.referee | Král Pavel, Doc. Ing. Ph.D. | |
dc.date.accepted | 2021-6-21 | |
dc.date.accessioned | 2021-06-25T12:37:33Z | - |
dc.date.available | 2020-9-11 | |
dc.date.available | 2021-06-25T12:37:33Z | - |
dc.date.issued | 2021 | |
dc.date.submitted | 2021-5-20 | |
dc.identifier | 86144 | |
dc.identifier.uri | http://hdl.handle.net/11025/44775 | |
dc.description.abstract | Mezi-jazyčná reprezentace významu je aktuální téma v oblasti zpracování přirozeného jazyka. Sémantické prostory z různých jazyků jsou transformovány do jednoho sdíleného univerzálního prostoru. Tento fakt umožňuje přenést znalosti z jazyků, které jsou velmi bohaté na zdroje, do jazyků, jež jsou na zdroje omezené. Cílem této diplomové práce bylo analyzovat, porovnat a implementovat dostupné metody pro jazykově nezávislou sémantickou reprezentaci. Většina souvisejících prací se zaměřuje na lineární transformace, jelikož vykazují velmi dobrý výkon. V této práci se však soustřeďujeme na zvolené nelineární transformace založené na umělých neuronových sítích a shlukování. Kvalita lineárních i nelineárních metod je následně vyhodnocena na různých úlohách, například datových sadách slovních podobností, slovních analogií a strojovém překladu. Nově implementované nelineární transformace v mnoha ohledech překonaly lineární transformace ve všech sledovaných kategoriích na rozdílných jazycích z odlišných jazykových rodin. | cs |
dc.format | 80 s. | cs |
dc.format.mimetype | application/pdf | |
dc.language.iso | cs | cs |
dc.publisher | Západočeská univerzita v Plzni | cs |
dc.rights | Plný text práce je přístupný bez omezení. | cs |
dc.subject | zpracování přirozeného jazyka | cs |
dc.subject | sémantická reprezentace | cs |
dc.subject | metoda nejmenších čtverců | cs |
dc.subject | ortogonální transformace | cs |
dc.subject | kanonická korelační analýza | cs |
dc.subject | nelineární transformace | cs |
dc.subject | neuronové sítě | cs |
dc.subject | shlukování | cs |
dc.subject | word2vec | cs |
dc.subject | fasttext | cs |
dc.subject | semeval | cs |
dc.title | Mezi-jazyčné transformace sémantických prostorů | cs |
dc.title.alternative | Cross-lingual transformations between semantic spaces | en |
dc.type | diplomová práce | cs |
dc.thesis.degree-name | Ing. | cs |
dc.thesis.degree-level | Navazující | cs |
dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
dc.thesis.degree-program | Inženýrská informatika | cs |
dc.description.result | Obhájeno | cs |
dc.rights.access | openAccess | en |
dc.description.abstract-translated | Cross-lingual meaning representation is a current topic in the field of Natural Language Processing. Semantic spaces of various languages are transformed into a shared universal space. It allows to transfer knowledge between languages, especially between resource-rich and resource-poor languages. This Master Thesis aims to analyze, compare and implement available methods of language independent semantic representation. Most of related works focus on linear projections as they showed a very good performance. In this thesis, however, we study non-linear methods based on artificial neural networks and clustering. Both linear and non-linear methods were subsequently evaluated on different tasks such as datasets containing word similarities, word analogies and machine translation. The newly implemented non-linear transformations consistently outperformed state-of-the-art linear transformations in all evaluation criteria and on several languages within different language families. | en |
dc.subject.translated | natural language processing | en |
dc.subject.translated | semantic representation | en |
dc.subject.translated | linear transformation | en |
dc.subject.translated | orthogonal transformation | en |
dc.subject.translated | canonical correlation analysis | en |
dc.subject.translated | non-linear transformation | en |
dc.subject.translated | neural networks | en |
dc.subject.translated | clustering | en |
dc.subject.translated | word2vec | en |
dc.subject.translated | fasttext | en |
dc.subject.translated | semeval | en |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
DP_Mistera_A19N0038P.pdf | Plný text práce | 753,72 kB | Adobe PDF | Zobrazit/otevřít |
A19N0038Phodnoceni-ved.PDF | Posudek vedoucího práce | 894,68 kB | Adobe PDF | Zobrazit/otevřít |
A19N0038Pposudek_op.pdf | Posudek oponenta práce | 41,94 kB | Adobe PDF | Zobrazit/otevřít |
A19N0038Pobhajoba.PDF | Průběh obhajoby práce | 212,63 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/44775
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.