Název: | Neuronové sítě pro zpracování přirozeného jazyka |
Další názvy: | Neural networks for natural language processing |
Autoři: | Čedík, Jan |
Vedoucí práce/školitel: | Bulín Martin, Ing. M.Sc. |
Oponent: | Frémund Adam, Ing. |
Datum vydání: | 2023 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | bakalářská práce |
URI: | http://hdl.handle.net/11025/55115 |
Klíčová slova: | neuronové sítě;zpracování přirozeného jazyka;transformer architektura;bert;t5;gpt;augmentace;úprava dat;chatbot |
Klíčová slova v dalším jazyce: | neural networks;natural language processing;transformer architecture;bert;t5;gpt;augmentation;data modification;chatbot |
Abstrakt: | Tato bakalářská práce se zabývá zpracováním přirozeného jazyka pomocí neuronových sítí. V současnosti dochází k rychlému rozvoji neuronových sítí v tomto oboru, přičemž společnost OpenAI je hlavním průkopníkem s jejími velkými modely založenými na architektuře Transformer. Teoretická část se zaměřuje právě na tuto architekturu, konkrétně na architektury T5, BERT a GPT. V praktické části provádíme experimenty jak v češtině, tak v angličtině, založené na architektuře T5. Shromáždili jsme data obsahující přirozené dialogy mezi jednotlivci. Pro dosažení co nejlepších předpovědí výstupu se snažíme o různé modifikace trénovacích dat, jako je značkování nebo augmentace. Hodnocení se provádí pomocí modelu sémantické návaznosti, který porovnává vstup a výstup modelu. |
Abstrakt v dalším jazyce: | This bachelor's thesis deals with natural language processing using neural networks. Currently, there is a rapid development of neural networks in this field, with the company OpenAI being a major pioneer with its large models based on the Transformer architecture. The theoretical part focuses on this architecture, specifically the T5, BERT, and GPT architectures. In the practical part, we conduct experiments in both Czech and English languages based on the T5 architecture. We gathered data containing natural dialogues between individuals. Through various modifications of the training data, such as tagging or augmentation, we aim to achieve the best possible output predictions. Evaluation is performed using a semantic continuity model, comparing the input and output of the model. |
Práva: | Plný text práce je přístupný bez omezení |
Vyskytuje se v kolekcích: | Bakalářské práce / Bachelor´s works (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
BP_Cedik.pdf | Plný text práce | 2,98 MB | Adobe PDF | Zobrazit/otevřít |
PosudekVedoucihoSTAG.pdf | Posudek vedoucího práce | 61,16 kB | Adobe PDF | Zobrazit/otevřít |
posudek.pdf | Posudek oponenta práce | 312,57 kB | Adobe PDF | Zobrazit/otevřít |
Prubeh obhajoby Cedik.pdf | Průběh obhajoby práce | 82,09 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/55115
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.