Název: Neuronové sítě pro zpracování přirozeného jazyka
Další názvy: Neural networks for natural language processing
Autoři: Čedík, Jan
Vedoucí práce/školitel: Bulín Martin, Ing. M.Sc.
Oponent: Frémund Adam, Ing.
Datum vydání: 2023
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: bakalářská práce
URI: http://hdl.handle.net/11025/55115
Klíčová slova: neuronové sítě;zpracování přirozeného jazyka;transformer architektura;bert;t5;gpt;augmentace;úprava dat;chatbot
Klíčová slova v dalším jazyce: neural networks;natural language processing;transformer architecture;bert;t5;gpt;augmentation;data modification;chatbot
Abstrakt: Tato bakalářská práce se zabývá zpracováním přirozeného jazyka pomocí neuronových sítí. V současnosti dochází k rychlému rozvoji neuronových sítí v tomto oboru, přičemž společnost OpenAI je hlavním průkopníkem s jejími velkými modely založenými na architektuře Transformer. Teoretická část se zaměřuje právě na tuto architekturu, konkrétně na architektury T5, BERT a GPT. V praktické části provádíme experimenty jak v češtině, tak v angličtině, založené na architektuře T5. Shromáždili jsme data obsahující přirozené dialogy mezi jednotlivci. Pro dosažení co nejlepších předpovědí výstupu se snažíme o různé modifikace trénovacích dat, jako je značkování nebo augmentace. Hodnocení se provádí pomocí modelu sémantické návaznosti, který porovnává vstup a výstup modelu.
Abstrakt v dalším jazyce: This bachelor's thesis deals with natural language processing using neural networks. Currently, there is a rapid development of neural networks in this field, with the company OpenAI being a major pioneer with its large models based on the Transformer architecture. The theoretical part focuses on this architecture, specifically the T5, BERT, and GPT architectures. In the practical part, we conduct experiments in both Czech and English languages based on the T5 architecture. We gathered data containing natural dialogues between individuals. Through various modifications of the training data, such as tagging or augmentation, we aim to achieve the best possible output predictions. Evaluation is performed using a semantic continuity model, comparing the input and output of the model.
Práva: Plný text práce je přístupný bez omezení
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
BP_Cedik.pdfPlný text práce2,98 MBAdobe PDFZobrazit/otevřít
PosudekVedoucihoSTAG.pdfPosudek vedoucího práce61,16 kBAdobe PDFZobrazit/otevřít
posudek.pdfPosudek oponenta práce312,57 kBAdobe PDFZobrazit/otevřít
Prubeh obhajoby Cedik.pdfPrůběh obhajoby práce82,09 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/55115

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.