Title: Shlukování textů podle jejich podobnosti pomocí modulu Scikit-learn
Other Titles: Clustering of texts based on their similarity using the Scikit-learn
Authors: Smolík, Tomáš
Advisor: Skorkovská, Lucie
Issue Date: 2013
Publisher: Západočeská univerzita v Plzni
Document type: bakalářská práce
URI: http://hdl.handle.net/11025/10442
Keywords: klasifikace;učení bez učitele;shlukování;K-means;analýza hlavních komponent;latentní sémantická analýza
Keywords in different language: classification;unsupervised learning;clustering;K-means;principal component analysis;latent semantic analysis
Abstract: Cílem práce je prozkoumat vybrané algoritmy klasifikace (učení bez učitele) a jejich vhodnost vzhledem k reálnému problému. Tímto problémem je shlukování, respektive dělení novinových článku do skupin v závislosti na jejich tématu. Vybrané algoritmy jsou K-means, analýza hlavních komponent a latentní sémantická analýza. Práce se kromě teoretického úvodu zabývá také experimentální částí, kde jsou vybrané metody otestovány dle určených kritérií.
Abstract in different language: The goal is to explore the selected classification algorithms (unsupervised learning) and their suitability for the real problem. This problem is the clustering or separation of newspaper articles into groups depending on their topic. The selected algorithms are the K-means, principal component analysis and latent semantic analysis. The work in addition to theoretical introduction also deals with the experimental part, where some methods are tested according to specific criteria.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Bakalářské práce / Bachelor´s works (KKY)

Files in This Item:
File Description SizeFormat 
BP_Smolik_final.pdfPlný text práce555,3 kBAdobe PDFView/Open
smolik-v.pdfPosudek vedoucího práce1,77 MBAdobe PDFView/Open
smolik-p.pdfPrůběh obhajoby práce847,49 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/10442

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.