Title: | Analýza příspěvků na sociální síti Twitter |
Other Titles: | Twitter post sentiment analysis |
Authors: | Hain, Jakub |
Advisor: | Ježek Karel, Prof. Ing. CSc. |
Issue Date: | 2019 |
Publisher: | Západočeská univerzita v Plzni |
Document type: | diplomová práce |
URI: | http://hdl.handle.net/11025/37430 |
Keywords: | sociální sítě;twitter;sentiment;klasifikace;maximální entropie;naivní bayes;svm;sumarizace;latentní sémantická analýza |
Keywords in different language: | social network;twitter;sentiment;classification;maximum entropy;naive bayes;svm;sumarization;latent semantic analysis |
Abstract: | Tato práce je zaměřena na analýzu sentimentu a sumarizaci dat. Konečné využití aplikace by melo být pro sociální sít Twitter v češtině. V textu jsou popsány jednotlivé metody strojového učení použité pro klasifikaci (Naivní Bayes, Support Vector Machine a Maximum Entropy). Extraktivní sumarizace je implementována pomocí Latentní sémantické analýzy. Vety jsou vybrány dvěma způsoby (Gong a Liu, Steinberger a Ježek). Sentiment byl testován na ohodnocených datech z českého Facebooku a anglických tweetech. Při testování na českých datech byly výsledky jednotlivých klasifikátoru srovnatelné kromě SVM. Sumarizace byla otestována na anglickém datasetu. Pro ověření byla použita metrika ROUGE-1, podle které obě verze sumarizace dosahovaly podobných výsledku. |
Abstract in different language: | This thesis focuses on sentiment analysis and data summarization. Final use of the application should be for social network Twitter in Czech language. The text shows several machine learning methods used for classification (Naive Bayes, Support Vector Machine and Maximum Entropy). Extractive summarization is implemented as Latent semantic analysis. Selection of sentences is implemented in 2 versions (Gong and Liu, Steinberger and Ježek). Sentiment was tested on classified data from Czech Facebook and English tweets. Testing on Czech data shows comparable results on all classifiers except SVM. Summarization was tested on English dataset. ROUGE-1 metric was used for verification. Both versions of LSA performed similarly. |
Rights: | Plný text práce je přístupný bez omezení. |
Appears in Collections: | Diplomové práce / Theses (KIV) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Hain_DP_Text_2019.pdf | Plný text práce | 1,27 MB | Adobe PDF | View/Open |
A16N0030Phodnoceni-ved.PDF | Posudek vedoucího práce | 433,35 kB | Adobe PDF | View/Open |
A16N0030Pposudek-op.PDF | Posudek oponenta práce | 439,16 kB | Adobe PDF | View/Open |
A16N0030Pobhajoba.PDF | Průběh obhajoby práce | 246,59 kB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11025/37430
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.