Název: | Detekce polarity textu s využitím mezijazyčné transformace |
Další názvy: | Text polarity detection using cross-lingual transformation |
Autoři: | Šmíd, Jakub |
Vedoucí práce/školitel: | Přibáň Pavel, Ing. |
Oponent: | Pražák Ondřej, Ing. |
Datum vydání: | 2021 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | bakalářská práce |
URI: | http://hdl.handle.net/11025/44232 |
Klíčová slova: | detekce polarity;mezijazyčné transformace;strojové učení;zpracování přirozeného jazyka;neuronové sítě;analýza sentimentu |
Klíčová slova v dalším jazyce: | polarity detection;cross-lingual transformations;machine learning;natural language processing;neural networks;sentiment analysis |
Abstrakt: | Tato bakalářská práce se zabývá detekcí polarity textu s využitím mezijazyčných transformací. Mezijazyčné transformace patří mezi metody, které umožňují přenos znalostí mezi jazyky. Konkrétně v této práci jsou použita anglická anotovaná data pro detekci polarity v českém textu. V rámci práce jsou navrženy a implementovány dva modely neuronových sítí - LSTM a CNN - v kombinaci se slovními vektory fastText. Modely jsou následně s využitím lineárních mezijazyčných transformací natrénovány na anglických datech a vyhodnoceny na českých datech. Výsledky těchto experimentů jsou porovnány s modely, které byly trénovány i vyhodnoceny pouze na češtině. Srovnání ukazuje, že s dostatečným množstvím výhradně anglických dat lze dosáhnout velmi dobrých výsledků, které jsou jen o 5 až 6 % horší v porovnání s modely trénovanými jen na českých datech. |
Abstrakt v dalším jazyce: | This bachelor's thesis focuses on text polarity detection using cross-lingual transformations. Cross-lingual transformations are among the methods that allow the transfer of knowledge between languages. Specifically, in this work, the English annotated data are used for polarity detection in Czech text. Within the thesis, two neural network models - LSTM and CNN - are proposed and implemented in combination with fastText word embeddings. The models are then trained on English data and evaluated on Czech data using linear cross-lingual transformations. The results of these experiments are compared with models that have been trained and evaluated only on Czech data. The comparison shows that with a sufficient amount of exclusively English data, it is possible to achieve very good results, which are only 5 to 6% worse compared to models trained only on Czech data. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Bakalářské práce / Bachelor´s works (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
BP_Jakub_Smid.pdf | Plný text práce | 1,04 MB | Adobe PDF | Zobrazit/otevřít |
A19B0675P_Hodnoceni.pdf | Posudek vedoucího práce | 265,02 kB | Adobe PDF | Zobrazit/otevřít |
A19B0675P_Posudek.pdf | Posudek oponenta práce | 237,11 kB | Adobe PDF | Zobrazit/otevřít |
A19B0675P_Obhajoba.pdf | Průběh obhajoby práce | 43,59 kB | Adobe PDF | Zobrazit/otevřít |
A19B0675P_zadaniBP.pdf | VŠKP - příloha | 17,36 kB | Adobe PDF | Zobrazit/otevřít |
BP_Jakub_Smid.zip | VŠKP - příloha | 4,31 GB | ZIP | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/44232
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.