Název: | Experimenty s metodami Active Learning na rozsáhlých datasetech přirozeného jazyka |
Autoři: | Mladý, Jakub |
Vedoucí práce/školitel: | Sido Jakub, Ing. |
Oponent: | Pražák Ondřej, Ing. |
Datum vydání: | 2023 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | bakalářská práce |
URI: | http://hdl.handle.net/11025/53926 |
Klíčová slova: | aktivní učení;zpracování přirozeného jazyka;umělá inteligence;strojové učení;neuronové sítě;transformery;huggingface;metacentrum;pytorch;modal;small-text;weights and biases |
Klíčová slova v dalším jazyce: | active learning;natural language processing;artificial intelligence;machine learning;neural networks;transformers;huggingface;metacentrum;pytorch;modal;small-text;weights and biases |
Abstrakt: | Aktivní učení je přístup k trénování modelů umělé inteligence v rámci učení s učite- lem. Motivací k jeho zavedení je šetření času a finančních prostředků při pořizování anotací trénovacích dat, jež jsou v mnoha úlohách strojového učení potřebné. Jeho paradigma je jednoduché: předpoklady jsou datová sada s několika málo označenými daty, model a anotátor. Následně do splnění vhodně zvolené ukončovací podmínky probíhá následující cyklus - naučit model na označené podmnožině, vybrat několik neoznačených vzorků a dotázat se anotátora na označení vybraných vzorků. Kri- tickou částí systému je pak výběr vzorků. Při použití vhodné strategie je možné vybrat takové prvky, jejichž naučením se model zlepší nejvíce. Právě tyto strategie jsou hlavním předmětem výzkumu aktivního učení. Tato práce nabízí průzkum již existujících strategií a poskytuje hodnocení přínosu některých strategií a aktivního učení jako celku z výsledků navržených experimentů. |
Abstrakt v dalším jazyce: | Active learning is an approach to training artificial intelligence models within super- vised learning. The motivation for its introduction comes from the need to spare time and financial resources in obtaining labels for the training data, which are fundamental for many machine learning tasks. Its paradigm is simple: the precon- ditions are a training dataset with a few data labeled, the model and an annotator. Then, the following cycle is repeated until some suitable terminal condition is met - train the model on labeled data, query for more unlabeled data and let the annotator provide the labels for the queried instances. The critical part of such a system lies in the startegy of querying for new data samples. With a desirable strategy, such data labels could be obtained, that imporve the model the most. These query strategies are the main subject of ongoing research in active learning. This work offers a sur- vey of existing strategies and provides evaluation of contribution of some chosen strategies and active learning as a whole from the results of proposed experiments. |
Práva: | Plný text práce je přístupný bez omezení |
Vyskytuje se v kolekcích: | Bakalářské práce / Bachelor´s works (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
A20B0190P_Bakalarska_prace.pdf | Plný text práce | 3,6 MB | Adobe PDF | Zobrazit/otevřít |
A20B0190P_Hodnoceni.pdf | Posudek vedoucího práce | 113,86 kB | Adobe PDF | Zobrazit/otevřít |
A20B0190P_Posudek.pdf | Posudek oponenta práce | 225,92 kB | Adobe PDF | Zobrazit/otevřít |
A20B0190P_Obhajoba.pdf | Průběh obhajoby práce | 43,62 kB | Adobe PDF | Zobrazit/otevřít |
A20B0190P_Zadani.pdf | VŠKP - příloha | 14,28 kB | Adobe PDF | Zobrazit/otevřít Vyžádat kopii |
A20B0190P_prilohy_2.zip | VŠKP - příloha | 27,89 MB | ZIP | Zobrazit/otevřít Vyžádat kopii |
A20B0190P_prilohy_1.zip | VŠKP - příloha | 1,84 GB | ZIP | Zobrazit/otevřít Vyžádat kopii |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/53926
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.