Název: | Systém porovnání studijních programů českých univerzit |
Další názvy: | System for comparison of study programmes of czech universities |
Autoři: | Hospaska, Martin |
Vedoucí práce/školitel: | Ježek Karel, Prof. Ing. CSc. |
Oponent: | Fiala Dalibor, Doc. Ing. Ph.D. |
Datum vydání: | 2017 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/27144 |
Klíčová slova: | univerzity;crawler;porovnání předmětů;webové stránky;uložíště dokumentů;elasticsearch;jsoup |
Klíčová slova v dalším jazyce: | universities;crawler;courses comparison;web pages;document database;elasticsearch;jsoup |
Abstrakt: | Výstupem této práce je aplikace webového crawleru a vlastní webové stránky, které slouží pro zobrazení dat získaných pomocí crawleru. Součástí práce je rovněž vybrané datové úložiště sloužící pro uchovávání a vyhledávání v~uložených datech. Po nasazení této práce na veřejně přístupný server je tak možné zájemcům o studium na vysoké škole nabídnout unikátní systém pro porovnávání předmětů vybraných univerzit. Text práce popisuje způsob vytvoření a následné využití kolekce předmětů vyučovaných na vybraných vysokých školách v ČR. Zaobírá se jak samotným stahováním informací z webů univerzit, tak jejich uložením v databázi a následným porovnáváním předmětů pomocí vytvořených webových stránek. Čtenář se v textu práce dozví, jakou strukturu mají webové stránky vybraných univerzit a jakým způsobem lze sestavit webový crawler, který dokáže z těchto stránek získávat data. Dozví se také o možnostech, jak stažená data uložit a následně s nimi pracovat. Pokud by si čtenář přál vytvořit webové stránky zobrazující stažená data, i o tomto se v textu dočte. |
Abstrakt v dalším jazyce: | The goal of this diploma thesis is to create a web crawler and corresponding user interface, which presents the data obtained from the crawler. The created project also consists of a data storage used for preserving the retrieved data from the crawler. Target users of this platform are students. The aforementioned system should help them with comparing units taught at different universities. For this, the platform needs to be deployed and available on the public network. This paper describes how the units are collected using the implemented crawler and how the collected data are interpreted. For this, courses at selected universities in the Czech Republic are used as testing data. In more details, the process of downloading the information from universities pages and storing it in the data storage is explained. Finally, the way how the collected data are compared is described. In the scope of this thesis, the structure of pages of selected universities is described and the steps how to create a custom web crawler to collect data from these pages are given as well. The reader can also learn about different ways how the data can be exported. The steps how to create a custom user interface presenting the collected data are also given in the thesis. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
Hospaska_Martin_A15N0039P_DP.pdf | Plný text práce | 1,89 MB | Adobe PDF | Zobrazit/otevřít |
A15N0039Phodnoceni-ved.PDF | Posudek vedoucího práce | 331,64 kB | Adobe PDF | Zobrazit/otevřít |
A15N0039Pposudek-op.PDF | Posudek oponenta práce | 664,62 kB | Adobe PDF | Zobrazit/otevřít |
A15N0039Pobhajoba.PDF | Průběh obhajoby práce | 218,81 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/27144
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.