Full metadata record
DC poleHodnotaJazyk
dc.contributor.advisorKonopík Miloslav, Ing. Ph.D.
dc.contributor.authorPašek, Jan
dc.contributor.refereePražák Ondřej, Ing.
dc.date.accepted2020-6-16
dc.date.accessioned2020-11-10T00:38:57Z-
dc.date.available2019-10-7
dc.date.available2020-11-10T00:38:57Z-
dc.date.issued2020
dc.date.submitted2020-5-7
dc.identifier82897
dc.identifier.urihttp://hdl.handle.net/11025/41785
dc.description.abstractTato bakalářská práce se zabývá vývojem neuronové sítě pro porozumění textu v odborném jazyce. Výstupy této práce mohou zlepšit výsledky úloh jako je získávání informací či generování zdrojového kódu. Pro vyřešení této úlohy představujeme novou architekturu neuronové sítě založenou na využití enkodéru kódu společně s textovým enkodérem. Architektura dále využívá nepříliš známou f1 loss, která významně zlepšuje dosažené výsledky. Důležitým výstupem této práce je vektorová reprezentace vět, která se nalézá ve skrytých vrstvách neuronové sítě. Navržený přístup je demonstrován na využití duplicitních otázek ze stránky Stackoverflow, ze kterých jsme připravili nový dataset použitelný nad rámec této práce. Pomocí navržené architektury bylo na datasetu dosaženo f1 score 74.1 %, což představuje zlepšení o 5.1 % v porovnání s výchozí architekturou založenou na sčítání reprezentací slov.cs
dc.format81 s. (87 600 znaků)cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.subjectstrojové učenícs
dc.subjectzpracování přirozeného jazykacs
dc.subjectsémantická podobnostcs
dc.subjectstackoverflowcs
dc.subjectneuronové sítěcs
dc.titleVyužití duplicitních otázek na Stackoverflow pro učení reprezentace významu větcs
dc.title.alternativeLearning of sentence encoding by using duplicate questions from Stackoverflow.en
dc.typebakalářská prácecs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-programInženýrská informatikacs
dc.description.resultObhájenocs
dc.rights.accessopenAccessen
dc.description.abstract-translatedThis bachelor thesis aims to create a neural network for natural language understanding in expert domains. Our outcome can significantly improve tasks such as information retrieval or code generation. The work proposes a neural network architecture utilizing a code encoder in parallel with a commonly used text encoder. Furthermore, the architecture uses a not widely known f1 loss, significantly improving results. An important outcome of this work is a vector representation of text stored in hidden layers of the network. We demonstrate our approach on Stackoverflow data utilizing duplicate questions to create a novel dataset, usable beyond the scope of this work. Our architecture achieved f1 score of 74.1%, which is a 5.1% improvement compared to a baseline model based on word embedding summation.en
dc.subject.translatedmachine learningen
dc.subject.translatednatural language processingen
dc.subject.translatedsemantic similarityen
dc.subject.translatedstackoverflowen
dc.subject.translatedneural networksen
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
BP_jan_pasek.pdfPlný text práce2,56 MBAdobe PDFZobrazit/otevřít
A17B0318P_Posudek.pdfPosudek oponenta práce248,63 kBAdobe PDFZobrazit/otevřít
A17B0318P_Hodnoceni.pdfPosudek vedoucího práce104,97 kBAdobe PDFZobrazit/otevřít
A17B0318P_Obhajoba.pdfPrůběh obhajoby práce59,28 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/41785

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.