Experimenty s metodami Active Learning na rozsáhlých datasetech přirozeného jazyka

Mladý, Jakub

Title:	Experimenty s metodami Active Learning na rozsáhlých datasetech přirozeného jazyka
Authors:	Mladý, Jakub
Advisor:	Sido Jakub, Ing.
Referee:	Pražák Ondřej, Ing.
Issue Date:	2023
Publisher:	Západočeská univerzita v Plzni
Document type:	bakalářská práce
URI:	http://hdl.handle.net/11025/53926
Keywords:	aktivní učení;zpracování přirozeného jazyka;umělá inteligence;strojové učení;neuronové sítě;transformery;huggingface;metacentrum;pytorch;modal;small-text;weights and biases
Keywords in different language:	active learning;natural language processing;artificial intelligence;machine learning;neural networks;transformers;huggingface;metacentrum;pytorch;modal;small-text;weights and biases
Abstract:	Aktivní učení je přístup k trénování modelů umělé inteligence v rámci učení s učite- lem. Motivací k jeho zavedení je šetření času a finančních prostředků při pořizování anotací trénovacích dat, jež jsou v mnoha úlohách strojového učení potřebné. Jeho paradigma je jednoduché: předpoklady jsou datová sada s několika málo označenými daty, model a anotátor. Následně do splnění vhodně zvolené ukončovací podmínky probíhá následující cyklus - naučit model na označené podmnožině, vybrat několik neoznačených vzorků a dotázat se anotátora na označení vybraných vzorků. Kri- tickou částí systému je pak výběr vzorků. Při použití vhodné strategie je možné vybrat takové prvky, jejichž naučením se model zlepší nejvíce. Právě tyto strategie jsou hlavním předmětem výzkumu aktivního učení. Tato práce nabízí průzkum již existujících strategií a poskytuje hodnocení přínosu některých strategií a aktivního učení jako celku z výsledků navržených experimentů.
Abstract in different language:	Active learning is an approach to training artificial intelligence models within super- vised learning. The motivation for its introduction comes from the need to spare time and financial resources in obtaining labels for the training data, which are fundamental for many machine learning tasks. Its paradigm is simple: the precon- ditions are a training dataset with a few data labeled, the model and an annotator. Then, the following cycle is repeated until some suitable terminal condition is met - train the model on labeled data, query for more unlabeled data and let the annotator provide the labels for the queried instances. The critical part of such a system lies in the startegy of querying for new data samples. With a desirable strategy, such data labels could be obtained, that imporve the model the most. These query strategies are the main subject of ongoing research in active learning. This work offers a sur- vey of existing strategies and provides evaluation of contribution of some chosen strategies and active learning as a whole from the results of proposed experiments.
Rights:	Plný text práce je přístupný bez omezení
Appears in Collections:	Bakalářské práce / Bachelor´s works (KIV)

Files in This Item:

File	Description	Size	Format
A20B0190P_Bakalarska_prace.pdf	Plný text práce	3,6 MB	Adobe PDF	View/Open
A20B0190P_Hodnoceni.pdf	Posudek vedoucího práce	113,86 kB	Adobe PDF	View/Open
A20B0190P_Posudek.pdf	Posudek oponenta práce	225,92 kB	Adobe PDF	View/Open
A20B0190P_Obhajoba.pdf	Průběh obhajoby práce	43,62 kB	Adobe PDF	View/Open

Show full item record

Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/53926

search

navigation