Název: | UWB at SemEval-2020 task 1: Lexical Semantic Change Detection |
Další názvy: | UWB na SemEval 2020 task 1: Detekce změny významu slov |
Autoři: | Pražák, Ondřej Přibáň, Pavel Taylor, Stephen Sido, Jakub |
Citace zdrojového dokumentu: | PRAŽÁK, O. PŘIBÁŇ, P. TAYLOR, S. SIDO, J. UWB at SemEval-2020 task 1: Lexical Semantic Change Detection. In Proceedings of the Fourteenth Workshop on Semantic Evaluation. Barcelona: International Committee for Computational Linguistics, 2020. s. 246-254. ISBN: 978-1-952148-31-6 |
Datum vydání: | 2020 |
Nakladatel: | International Committee for Computational Linguistics |
Typ dokumentu: | konferenční příspěvek ConferenceObject |
URI: | 2-s2.0-85119501699 http://hdl.handle.net/11025/47004 |
ISBN: | 978-1-952148-31-6 |
Klíčová slova: | zpracování přirozeného jazyka;sémantická analýza;změna významu slov;lineární transformace;model založený na vektorovém prostoru |
Klíčová slova v dalším jazyce: | Natural language processing;semantic analysis;lexical semantic;change detection;linear transformation;vector space model |
Abstrakt: | Článek popisuje naší metodu pro určení změny sémantiky slov v čase (Lexical Semantic Change Detection). Změnu významu slov měříme mezi dvěma korpusy ve čtyřech jazycích, Angličtině Němčině, Latině a Švédštině. Metoda byla vytvořena pro soutěž SemEval 2020 Task 1: Unsupervised Lexical Semantic Change Detection. Umístili jsme se na prvním místě v podúloze binární detekce změny a na čtvrtém místě v podúloze určení míry změny. Naše metoda využívá učení bez učitele a je nezávislá na jazyce. Skládá se z několika kroků: Vytvoření vektorového modelu slov pro oba korpusy,nalezení optimální lineární transformace mezi dvěma prostory s využitím Kanonické korelační analýzy a Ortogonální transformace; Dále změříme kosínovou podobnost zkoumaného slova v obou transformovaných vektorových prostorech. |
Abstrakt v dalším jazyce: | In this paper, we describe our method for detection of lexical semantic change, i.e., word sense changes over time. We examine semantic differences between specific words in two corpora,chosen from different time periods, for English, German, Latin, and Swedish. Our method was created for the SemEval 2020 Task 1:Unsupervised Lexical Semantic Change Detection.We ranked 1st in Sub-task 1: binary change detection, and 4th in Sub-task 2: ranked change detection. Our method is fully unsupervised and language independent. It consists of preparing a semantic vector space for each corpus, earlier and later; computing a linear transformation between earlier and later spaces, using Canonical Correlation Analysis and Orthogonal Transformation; and measuring the cosines between the transformed vector for the target word from the earlier corpus and the vector for the target word in the later corpus. |
Práva: | © SemWal |
Vyskytuje se v kolekcích: | Konferenční příspěvky / Conference Papers (KIV) OBD |
Soubory připojené k záznamu:
Soubor | Velikost | Formát | |
---|---|---|---|
Pražák 2020.semeval-1.30.pdf | 289,63 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/47004
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.