Title: Kategorizace zákaznické zpětné vazby nezávislá na jazyce
Other Titles: Categorization of customer feedback independent of the language
Authors: Průcha, Pavel
Advisor: Steinberger Josef, Doc. Ing. Ph.D.
Referee: Přibáň Pavel, Ing.
Issue Date: 2023
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/53738
Keywords: nlp;strojové učení;neuronové sítě
Keywords in different language: nlp;machine learning;neural networks
Abstract: Kategorizaci zákaznické zpětné vazby využívají různé společnosti pro zkvalitnění produktu nebo služby, kterou nabízí. Tato diplomová práce se zabývá kategorizací zákaznické zpětné vazby nezávislé na jazyce. Konverze mezi jazyky využívá transformaci vektorového prostoru pomocí transformační matice a strojový překlad. Datový korpus pro trénování a testování klasifikátorů je vytvořen z recenzí řetězce McDonald's, ve kterých je následně manuálně označený sentiment ve vybraných kategoriích. Tímto způsobem je vytvořený trénovací korpus z českých recenzí a testovací korpusy z anglických a německých recenzí. Data jsou v různých kombinacích testována primárně na neuronových sítích CNN a LSTM s vektorovou reprezentací textu word2vec a fasttext. Nejúspěšnější kombinací modelů je LSTM s fasttext, která je použita v demonstrátoru práce.
Abstract in different language: Categorization of customer feedback is used by various companies to improve the quality of the product or service they offer. This thesis deals with language-independent categorization of customer feedback. Conversion between languages uses vector space transformation using a transformation matrix and machine translation. The data corpus for training and testing classifiers is created from reviews of the chain McDonald's, in which the sentiment in selected categories is then manually annotated. In this way, the training corpus is created from Czech reviews and the test corpus from English and German reviews. Data are tested in various combinations primarily on neural networks CNN and LSTM with word embeddings word2vec and fasttext. The most successful combination of models is LSTM with fasttext, which are used in the work demonstrator.
Rights: Plný text práce je přístupný bez omezení
Appears in Collections:Diplomové práce / Theses (KIV)

Files in This Item:
File Description SizeFormat 
A20N0102P_DP.pdfPlný text práce1,16 MBAdobe PDFView/Open
A20N0102Pposudek-op.pdfPosudek oponenta práce251,61 kBAdobe PDFView/Open
A20N0102Phodnoceni-ved.pdfPosudek vedoucího práce102,18 kBAdobe PDFView/Open
A20N0102Pobhajoba.pdfPrůběh obhajoby práce528,28 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/53738

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.