Title: Mezijazyčná aspektově orientovaná analýza sentimentu
Other Titles: Cross-lingual Aspect-Based Sentiment Analysis
Authors: Šmíd, Jakub
Advisor: Přibáň Pavel, Ing.
Referee: Pražák Ondřej, Ing.
Issue Date: 2023
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/53739
Keywords: zpracování přirozeného jazyka;aspektová analýza sentimentu;strojové učení;mezijazyčná aspektová analýza sentimentu;neuronové sítě;prompting;transformers;sequence-to-sequence modely
Keywords in different language: natural language processing;aspect-based sentiment analysis;machine learning;cross-lingual aspect-based sentiment analysis;neural networks;prompting;transformers;sequence-to-sequence models
Abstract: Tato práce se zaměřuje na mezijazyčnou aspektově orientovanou analýzu sentimentu (ABSA), která je na rozdíl od jednojazyčné ABSA málo probádanou oblastí. V této práci jsou navrženy dvě metody, které lze použít jak s tradičním trénováním (fine-tuning), tak s použitím techniky zvané "prompting". První metodou je sequence-to-sequence metoda pro řešení více úloh ABSA současně a překonává předchozí state-of-the-art výsledky na referenčních datasetech. Prompting výrazně zlepšuje úspěšnost modelu T5 a jeho vícejazyčné verze, což vedlo k nejlepším celkovým výsledkům mezi testovanými modely. Slibné jsou také nejlepší mezijazyčné výsledky. Druhá metoda klasifikuje polarity sentimentu aspektových výrazů a kategorií, přičemž stanovuje nové nejlepší výsledky ve více jazycích a dosahuje vynikajících mezijazyčných výsledků, často v rozmezí 2 % od jednojazyčných výsledků. Kromě toho tato práce představuje nově anotovaný český dataset pro ABSA.
Abstract in different language: This thesis focuses on cross-lingual aspect-based sentiment analysis (ABSA), an understudied area in contrast to monolingual ABSA. This thesis proposes two methods that can be used with prompting and traditional-based fine-tuning. The first method is a sequence-to-sequence method that solves multiple ABSA tasks simultaneously and outperforms previous state-of-the-art results on benchmark datasets in multiple languages. Prompting improves the performance of the T5 model and its multilingual version significantly, which resulted in the best overall results among the tested models. The best cross-lingual results are also promising. The second method classifies the sentiment polarity of aspect terms and categories, establishing new state-of-the-art results in multiple languages and achieving excellent cross-lingual results, often within 2% of monolingual results. In addition, this thesis presents a newly annotated Czech dataset for ABSA.
Rights: Plný text práce je přístupný bez omezení
Appears in Collections:Diplomové práce / Theses (KIV)

Files in This Item:
File Description SizeFormat 
DP_Jakub_Smid.pdfPlný text práce2,04 MBAdobe PDFView/Open
A21N0073Phodnoceni-ved.pdfPosudek vedoucího práce255,38 kBAdobe PDFView/Open
A21N0073Pposudek-op.pdfPosudek oponenta práce237,33 kBAdobe PDFView/Open
A21N0073Pobhajoba.pdfPrůběh obhajoby práce530,79 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/53739

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.