Název: Experimenty s metodami Active Learning na rozsáhlých datasetech přirozeného jazyka
Autoři: Mladý, Jakub
Vedoucí práce/školitel: Sido Jakub, Ing.
Oponent: Pražák Ondřej, Ing.
Datum vydání: 2023
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: bakalářská práce
URI: http://hdl.handle.net/11025/53926
Klíčová slova: aktivní učení;zpracování přirozeného jazyka;umělá inteligence;strojové učení;neuronové sítě;transformery;huggingface;metacentrum;pytorch;modal;small-text;weights and biases
Klíčová slova v dalším jazyce: active learning;natural language processing;artificial intelligence;machine learning;neural networks;transformers;huggingface;metacentrum;pytorch;modal;small-text;weights and biases
Abstrakt: Aktivní učení je přístup k trénování modelů umělé inteligence v rámci učení s učite- lem. Motivací k jeho zavedení je šetření času a finančních prostředků při pořizování anotací trénovacích dat, jež jsou v mnoha úlohách strojového učení potřebné. Jeho paradigma je jednoduché: předpoklady jsou datová sada s několika málo označenými daty, model a anotátor. Následně do splnění vhodně zvolené ukončovací podmínky probíhá následující cyklus - naučit model na označené podmnožině, vybrat několik neoznačených vzorků a dotázat se anotátora na označení vybraných vzorků. Kri- tickou částí systému je pak výběr vzorků. Při použití vhodné strategie je možné vybrat takové prvky, jejichž naučením se model zlepší nejvíce. Právě tyto strategie jsou hlavním předmětem výzkumu aktivního učení. Tato práce nabízí průzkum již existujících strategií a poskytuje hodnocení přínosu některých strategií a aktivního učení jako celku z výsledků navržených experimentů.
Abstrakt v dalším jazyce: Active learning is an approach to training artificial intelligence models within super- vised learning. The motivation for its introduction comes from the need to spare time and financial resources in obtaining labels for the training data, which are fundamental for many machine learning tasks. Its paradigm is simple: the precon- ditions are a training dataset with a few data labeled, the model and an annotator. Then, the following cycle is repeated until some suitable terminal condition is met - train the model on labeled data, query for more unlabeled data and let the annotator provide the labels for the queried instances. The critical part of such a system lies in the startegy of querying for new data samples. With a desirable strategy, such data labels could be obtained, that imporve the model the most. These query strategies are the main subject of ongoing research in active learning. This work offers a sur- vey of existing strategies and provides evaluation of contribution of some chosen strategies and active learning as a whole from the results of proposed experiments.
Práva: Plný text práce je přístupný bez omezení
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
A20B0190P_Bakalarska_prace.pdfPlný text práce3,6 MBAdobe PDFZobrazit/otevřít
A20B0190P_Hodnoceni.pdfPosudek vedoucího práce113,86 kBAdobe PDFZobrazit/otevřít
A20B0190P_Posudek.pdfPosudek oponenta práce225,92 kBAdobe PDFZobrazit/otevřít
A20B0190P_Obhajoba.pdfPrůběh obhajoby práce43,62 kBAdobe PDFZobrazit/otevřít
A20B0190P_Zadani.pdfVŠKP - příloha14,28 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii
A20B0190P_prilohy_2.zipVŠKP - příloha27,89 MBZIPZobrazit/otevřít  Vyžádat kopii
A20B0190P_prilohy_1.zipVŠKP - příloha1,84 GBZIPZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/53926

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.