Název: | Automatická detekce klíčových slov v textu |
Další názvy: | Automatic keyword detection |
Autoři: | Krajňák, Jan |
Vedoucí práce/školitel: | Sido Jakub, Ing. |
Oponent: | Pražák Ondřej, Ing. |
Datum vydání: | 2022 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | bakalářská práce |
URI: | http://hdl.handle.net/11025/49552 |
Klíčová slova: | automatická extrakce klíčových slov;tf-idf;textrank;yake;keybert;bert;čtk;semeval |
Klíčová slova v dalším jazyce: | automatic keyword extraction;tf-idf;textrank;yake;keybert;bert;čtk;semeval |
Abstrakt: | Tato práce se zabývá problematikou automatické extrakce klíčových slov z textu. Nejprve jsou analyzovány již existující přístupy k řešení problému. Některé z existujících přístupů byly vybrány a vyzkoušeny na anglické datové sadě, použité i při soutěži SemEval 2010. Stejné metody byly rovněž otestovány na zcela nové, nikdy netestované datové sadě získané při spolupráci s Českou tiskovou kanceláří. Jelikož tento nový korpus obsahuje dostatek označených dat, práce se v další části zabývá návrhem metody využívající přístup učení s učitelem založené na BERT modelech a následném porovnání s již existujícími metodami. |
Abstrakt v dalším jazyce: | This thesis deals with automatic keywords extraction from documents. First, it analyzes already existing approaches to solve the problem then tests some of the methods on a dataset from SemEval 2010 competition. Same methods are then tested on a completely new czech dataset which has been obtained with cooperation with ČTK. As this new corpus contains enough annotated documents, the work in the final part deals with a proposal of a supervised method based on BERT models and the subsequent comparisson with already existing methods. |
Práva: | Plný text práce je přístupný bez omezení |
Vyskytuje se v kolekcích: | Bakalářské práce / Bachelor´s works (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
A19B0103P.pdf | Plný text práce | 1,77 MB | Adobe PDF | Zobrazit/otevřít |
A19B0103P_hodnoceni.pdf | Posudek vedoucího práce | 117,37 kB | Adobe PDF | Zobrazit/otevřít |
A19B0103P_posudek.pdf | Posudek oponenta práce | 235,9 kB | Adobe PDF | Zobrazit/otevřít |
A19B0103P_obhajoba.pdf | Průběh obhajoby práce | 85,35 kB | Adobe PDF | Zobrazit/otevřít |
A19B0103P_zadaniBP.pdf | VŠKP - příloha | 12,83 kB | Adobe PDF | Zobrazit/otevřít |
A19B0103P_prilohy.zip | VŠKP - příloha | 46,96 MB | ZIP | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/49552
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.