Název: | Aspekty analýzy sentimentu |
Další názvy: | Aspects of Sentiment Analysis |
Autoři: | Hercig, Tomáš |
Vedoucí práce/školitel: | Král Pavel, Doc. Ing. Ph.D. |
Datum vydání: | 2018 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | disertační práce |
URI: | http://hdl.handle.net/11025/33648 |
Klíčová slova: | analýza sentimentu;detekce sarkasmu;zpracování přirozeného jazyka;strojové učení |
Klíčová slova v dalším jazyce: | sentiment analysis;sarcasm detection;natural language processing;machine learning |
Abstrakt: | Analýza sentimentu je podúloha zpracování přirozeného jazyka, která se obecně zabývá automatickou extrakcí a analýzou pocitů, názorů, emocí a přesvědčení vyjádřených v psaném textu. Analýza sentimentu se stala hlavní oblastí výzkumu již od počátku nového tisíciletí. Dopad analýzy sentimentu lze pozorovat v mnoha praktických aplikacích, od analýzy recenzí produktů až po předpovědi prodeje a akciových trhů pomocí monitorování sociálních médií. Abychom správně identifikovali sentiment obsažený v textu, musíme dostatečně pochopit význam (sémantiku) textu. Sémantika věty s obrazným vyjádřením však může být zcela odlišná od téže věty s doslovným významem. Nesprávná interpretace obrazných vyjádření, jako je ironie, sarkasmus a metafora, představuje závažný problém v oblasti analýzy sentimentu. Náš výzkum zahrnuje tvorbu datových zdrojů jak pro analýzu sentimentu na úrovni dokumentů, tak pro aspektově orientovanou analýzu sentimentu, dále pak experimenty s předzpracováním dat, výběrem příznaků, různými příznaky například s využitím sémantických modelů, neuronovými sítěmi, klasifikátory a průkopnický výzkum detekce sarkasmu v češtině. V práci zkoumáme také dopad použití obrazných vyjádření na analýzu sentimentu. |
Abstrakt v dalším jazyce: | Sentiment analysis is a sub-field of natural language processing. Generally, it deals with an automatic extraction and analysis of sentiments, opinions, emotions, and beliefs expressed in written text. Sentiment analysis has become a mainstream research field since the early 2000s. Its impact can be seen in many practical applications, ranging from analysing product reviews to predicting sales and stock markets using social media monitoring. In order to correctly identify the sentiment hidden in a text, we need to sufficiently understand the meaning (semantics) of the text. However, the semantics of a sentence with figurative language can be quite different from the same sentence with literal meaning. Misinterpreting figurative language such as irony, sarcasm, and metaphor represents a significant challenge in sentiment analysis. This thesis studies document-level sentiment analysis, aspect-based sentiment analysis, sarcasm detection, and the impact of figurative language on sentiment analysis. We place special emphasis on the Czech language. Our research includes the creation of data resources for both document-level and aspect-based sentiment analysis, experiments with data preprocessing, feature selection, various features e.g. using semantic models, neural networks, classifiers, and pioneer research into sarcasm detection in Czech. We also explore the impact of figurative language on sentiment analysis. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Disertační práce / Dissertations (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
tigi-PhDThesis_print_black.pdf | Plný text práce | 1,69 MB | Adobe PDF | Zobrazit/otevřít |
posudky-odp-hercig.pdf | Posudek oponenta práce | 2,39 MB | Adobe PDF | Zobrazit/otevřít |
protokol-odp-hercig.pdf | Průběh obhajoby práce | 863,81 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/33648
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.