Title: Efektivní analýza velkých dat pomocí Apache Spark a samoučících neuronových sítí na jediném počítači
Authors: Andrešič, David
Šaloun, Petr
Citation: STEINBERGER, Josef ed.; ZÍMA, Martin ed.; FIALA, Dalibor ed.; DOSTAL, Martin ed.; NYKL, Michal ed. Data a znalosti 2017: sborník konference, Plzeň, Hotel Angelo 5. - 6. října 2017. 1. vyd. Plzeň: Západočeská univerzita v Plzni, 2017, s. 67-71. ISBN 978-80-261-0720-0.
Issue Date: 2017
Publisher: Západočeská univerzita v Plzni
Document type: konferenční příspěvek
conferenceObject
URI: https://www.zcu.cz/export/sites/zcu/pracoviste/vyd/online/DataAZnalosti2017.pdf
http://hdl.handle.net/11025/26338
ISBN: 978-80-261-0720-0
Keywords: Apache Spark;samoučící neuronové sítě;velká data;Twitter;brexit;burza
Keywords in different language: Apache Spark;self-learning neural networks;big data;Twitter;brexit;stock exchange
Abstract: Apache Spark je běžně používaná platforma pro analýzu velkých dat na velkých počítačových clusterech, kde pro svou práci využívá především hlavní paměť počítače. Pokusili jsme se přidat softwarovou knihovnu samoučící se neuronové sítě do jednoho takového analytického celku pro big data. Výsle-dek je efektivní a rychlý dokonce na jediném běžném počítači. Tento přístup je přínosem pro výzkumníky s omezenými zdroji, kterým přiná-ší možnost analýzy velkých dat. Náš nápad byl experimentálně ověřen a je popsán zde. Jako případovou studii pro naši metodu jsme použili dostupná data ze sociální sítě Twitter, konkrétně tweety pro hashtag #Brexit a jejich analýzu sentimentu, přičemž jsme hledali korelace s burzovními daty.
Rights: © Západočeská univerzita v Plzni
Appears in Collections:Data a znalosti 2017
Data a znalosti 2017

Files in This Item:
File Description SizeFormat 
Andresic.pdfPlný text706,17 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/26338

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.