Název: | Mezijazyčná aspektově orientovaná analýza sentimentu |
Další názvy: | Cross-lingual Aspect-Based Sentiment Analysis |
Autoři: | Šmíd, Jakub |
Vedoucí práce/školitel: | Přibáň Pavel, Ing. |
Oponent: | Pražák Ondřej, Ing. |
Datum vydání: | 2023 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/53739 |
Klíčová slova: | zpracování přirozeného jazyka;aspektová analýza sentimentu;strojové učení;mezijazyčná aspektová analýza sentimentu;neuronové sítě;prompting;transformers;sequence-to-sequence modely |
Klíčová slova v dalším jazyce: | natural language processing;aspect-based sentiment analysis;machine learning;cross-lingual aspect-based sentiment analysis;neural networks;prompting;transformers;sequence-to-sequence models |
Abstrakt: | Tato práce se zaměřuje na mezijazyčnou aspektově orientovanou analýzu sentimentu (ABSA), která je na rozdíl od jednojazyčné ABSA málo probádanou oblastí. V této práci jsou navrženy dvě metody, které lze použít jak s tradičním trénováním (fine-tuning), tak s použitím techniky zvané "prompting". První metodou je sequence-to-sequence metoda pro řešení více úloh ABSA současně a překonává předchozí state-of-the-art výsledky na referenčních datasetech. Prompting výrazně zlepšuje úspěšnost modelu T5 a jeho vícejazyčné verze, což vedlo k nejlepším celkovým výsledkům mezi testovanými modely. Slibné jsou také nejlepší mezijazyčné výsledky. Druhá metoda klasifikuje polarity sentimentu aspektových výrazů a kategorií, přičemž stanovuje nové nejlepší výsledky ve více jazycích a dosahuje vynikajících mezijazyčných výsledků, často v rozmezí 2 % od jednojazyčných výsledků. Kromě toho tato práce představuje nově anotovaný český dataset pro ABSA. |
Abstrakt v dalším jazyce: | This thesis focuses on cross-lingual aspect-based sentiment analysis (ABSA), an understudied area in contrast to monolingual ABSA. This thesis proposes two methods that can be used with prompting and traditional-based fine-tuning. The first method is a sequence-to-sequence method that solves multiple ABSA tasks simultaneously and outperforms previous state-of-the-art results on benchmark datasets in multiple languages. Prompting improves the performance of the T5 model and its multilingual version significantly, which resulted in the best overall results among the tested models. The best cross-lingual results are also promising. The second method classifies the sentiment polarity of aspect terms and categories, establishing new state-of-the-art results in multiple languages and achieving excellent cross-lingual results, often within 2% of monolingual results. In addition, this thesis presents a newly annotated Czech dataset for ABSA. |
Práva: | Plný text práce je přístupný bez omezení |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
DP_Jakub_Smid.pdf | Plný text práce | 2,04 MB | Adobe PDF | Zobrazit/otevřít |
A21N0073Phodnoceni-ved.pdf | Posudek vedoucího práce | 255,38 kB | Adobe PDF | Zobrazit/otevřít |
A21N0073Pposudek-op.pdf | Posudek oponenta práce | 237,33 kB | Adobe PDF | Zobrazit/otevřít |
A21N0073Pobhajoba.pdf | Průběh obhajoby práce | 530,79 kB | Adobe PDF | Zobrazit/otevřít |
A21N0073P-zadani_DP.pdf | VŠKP - příloha | 14,16 kB | Adobe PDF | Zobrazit/otevřít Vyžádat kopii |
A21N0073P_prilohy.zip | VŠKP - příloha | 6,34 MB | ZIP | Zobrazit/otevřít Vyžádat kopii |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/53739
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.