Název: Mezijazyčná aspektově orientovaná analýza sentimentu
Další názvy: Cross-lingual Aspect-Based Sentiment Analysis
Autoři: Šmíd, Jakub
Vedoucí práce/školitel: Přibáň Pavel, Ing.
Oponent: Pražák Ondřej, Ing.
Datum vydání: 2023
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/53739
Klíčová slova: zpracování přirozeného jazyka;aspektová analýza sentimentu;strojové učení;mezijazyčná aspektová analýza sentimentu;neuronové sítě;prompting;transformers;sequence-to-sequence modely
Klíčová slova v dalším jazyce: natural language processing;aspect-based sentiment analysis;machine learning;cross-lingual aspect-based sentiment analysis;neural networks;prompting;transformers;sequence-to-sequence models
Abstrakt: Tato práce se zaměřuje na mezijazyčnou aspektově orientovanou analýzu sentimentu (ABSA), která je na rozdíl od jednojazyčné ABSA málo probádanou oblastí. V této práci jsou navrženy dvě metody, které lze použít jak s tradičním trénováním (fine-tuning), tak s použitím techniky zvané "prompting". První metodou je sequence-to-sequence metoda pro řešení více úloh ABSA současně a překonává předchozí state-of-the-art výsledky na referenčních datasetech. Prompting výrazně zlepšuje úspěšnost modelu T5 a jeho vícejazyčné verze, což vedlo k nejlepším celkovým výsledkům mezi testovanými modely. Slibné jsou také nejlepší mezijazyčné výsledky. Druhá metoda klasifikuje polarity sentimentu aspektových výrazů a kategorií, přičemž stanovuje nové nejlepší výsledky ve více jazycích a dosahuje vynikajících mezijazyčných výsledků, často v rozmezí 2 % od jednojazyčných výsledků. Kromě toho tato práce představuje nově anotovaný český dataset pro ABSA.
Abstrakt v dalším jazyce: This thesis focuses on cross-lingual aspect-based sentiment analysis (ABSA), an understudied area in contrast to monolingual ABSA. This thesis proposes two methods that can be used with prompting and traditional-based fine-tuning. The first method is a sequence-to-sequence method that solves multiple ABSA tasks simultaneously and outperforms previous state-of-the-art results on benchmark datasets in multiple languages. Prompting improves the performance of the T5 model and its multilingual version significantly, which resulted in the best overall results among the tested models. The best cross-lingual results are also promising. The second method classifies the sentiment polarity of aspect terms and categories, establishing new state-of-the-art results in multiple languages and achieving excellent cross-lingual results, often within 2% of monolingual results. In addition, this thesis presents a newly annotated Czech dataset for ABSA.
Práva: Plný text práce je přístupný bez omezení
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
DP_Jakub_Smid.pdfPlný text práce2,04 MBAdobe PDFZobrazit/otevřít
A21N0073Phodnoceni-ved.pdfPosudek vedoucího práce255,38 kBAdobe PDFZobrazit/otevřít
A21N0073Pposudek-op.pdfPosudek oponenta práce237,33 kBAdobe PDFZobrazit/otevřít
A21N0073Pobhajoba.pdfPrůběh obhajoby práce530,79 kBAdobe PDFZobrazit/otevřít
A21N0073P-zadani_DP.pdfVŠKP - příloha14,16 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii
A21N0073P_prilohy.zipVŠKP - příloha6,34 MBZIPZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/53739

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.