Full metadata record
DC FieldValueLanguage
dc.contributor.advisorJežek Karel, Prof. Ing. CSc.
dc.contributor.authorHain, Jakub
dc.date.accepted2019-6-18
dc.date.accessioned2020-07-17T13:41:25Z-
dc.date.available2018-9-11
dc.date.available2020-07-17T13:41:25Z-
dc.date.issued2019
dc.date.submitted2019-5-13
dc.identifier79959
dc.identifier.urihttp://hdl.handle.net/11025/37430
dc.description.abstractTato práce je zaměřena na analýzu sentimentu a sumarizaci dat. Konečné využití aplikace by melo být pro sociální sít Twitter v češtině. V textu jsou popsány jednotlivé metody strojového učení použité pro klasifikaci (Naivní Bayes, Support Vector Machine a Maximum Entropy). Extraktivní sumarizace je implementována pomocí Latentní sémantické analýzy. Vety jsou vybrány dvěma způsoby (Gong a Liu, Steinberger a Ježek). Sentiment byl testován na ohodnocených datech z českého Facebooku a anglických tweetech. Při testování na českých datech byly výsledky jednotlivých klasifikátoru srovnatelné kromě SVM. Sumarizace byla otestována na anglickém datasetu. Pro ověření byla použita metrika ROUGE-1, podle které obě verze sumarizace dosahovaly podobných výsledku.cs
dc.format86 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.subjectsociální sítěcs
dc.subjecttwittercs
dc.subjectsentimentcs
dc.subjectklasifikacecs
dc.subjectmaximální entropiecs
dc.subjectnaivní bayescs
dc.subjectsvmcs
dc.subjectsumarizacecs
dc.subjectlatentní sémantická analýzacs
dc.titleAnalýza příspěvků na sociální síti Twittercs
dc.title.alternativeTwitter post sentiment analysisen
dc.typediplomová prácecs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-programInženýrská informatikacs
dc.description.resultObhájenocs
dc.rights.accessopenAccessen
dc.description.abstract-translatedThis thesis focuses on sentiment analysis and data summarization. Final use of the application should be for social network Twitter in Czech language. The text shows several machine learning methods used for classification (Naive Bayes, Support Vector Machine and Maximum Entropy). Extractive summarization is implemented as Latent semantic analysis. Selection of sentences is implemented in 2 versions (Gong and Liu, Steinberger and Ježek). Sentiment was tested on classified data from Czech Facebook and English tweets. Testing on Czech data shows comparable results on all classifiers except SVM. Summarization was tested on English dataset. ROUGE-1 metric was used for verification. Both versions of LSA performed similarly.en
dc.subject.translatedsocial networken
dc.subject.translatedtwitteren
dc.subject.translatedsentimenten
dc.subject.translatedclassificationen
dc.subject.translatedmaximum entropyen
dc.subject.translatednaive bayesen
dc.subject.translatedsvmen
dc.subject.translatedsumarizationen
dc.subject.translatedlatent semantic analysisen
Appears in Collections:Diplomové práce / Theses (KIV)

Files in This Item:
File Description SizeFormat 
Hain_DP_Text_2019.pdfPlný text práce1,27 MBAdobe PDFView/Open
A16N0030Phodnoceni-ved.PDFPosudek vedoucího práce433,35 kBAdobe PDFView/Open
A16N0030Pposudek-op.PDFPosudek oponenta práce439,16 kBAdobe PDFView/Open
A16N0030Pobhajoba.PDFPrůběh obhajoby práce246,59 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/37430

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.