Název: | UWB @ DIACR-Ita: Lexical Semantic Change Detection with CCA and Orthogonal Transformation |
Další názvy: | UWB @ DIACR-Ita: Detakce změny významu slov s využitím CCA a ortogonální transformace |
Autoři: | Pražák, Ondřej Přibáň, Pavel Taylor, Stephen |
Citace zdrojového dokumentu: | PRAŽÁK, O., PŘIBÁŇ, P., TAYLOR, S. UWB @ DIACR-Ita: Lexical Semantic Change Detection with CCA and Orthogonal Transformation. In: Proceedings of the Seventh Evaluation Campaign of Natural Language Processing and Speech Tools for Italian. Final Workshop (EVALITA 2020). online: CEUR Workshop Proceedings, 2020. s. 1-6. ISSN 1613-0073. |
Datum vydání: | 2020 |
Nakladatel: | CEUR Workshop Proceedings |
Typ dokumentu: | konferenční příspěvek conferenceObject |
URI: | 2-s2.0-85097525328 http://hdl.handle.net/11025/42686 |
ISSN: | 1613-0073 |
Klíčová slova: | Zpracování přirozeného jazyka;sémantická analýza;změna významu slov;lineární transformace;model založený na vektorovém prostoru. |
Klíčová slova v dalším jazyce: | Natural language processing;semantic analysis;lexical semantic change detection;linear transformation;vector space model |
Abstrakt: | Článek popisuje naší metodu pro určení změny sémantiky slov v čase (Lexical Semantic Change Detection) pro soutěž DIACR-Ita, kde jsme skončili na prvním místě. Naše metoda využívá učení bez učitele a je nezávislá na jazyce. skládá se z několika kroků: Vytvoření vektorového modelu slov pro oba korpusy,nalezení optimální lineární transformace mezi dvěma prostory s využitím Kanonické korelační analýzy a Ortogonální transformace; Dále změříme kosínovou podobnost zkoumaného slova v obou transformovaných vektorových prostorech. |
Abstrakt v dalším jazyce: | In this paper, we describe our method for detection of lexical semantic change (i.e.,word sense changes over time) for the DIACR-Ita shared task, where we ranked 1st. We examine semantic differences between specific words in two Italian corpora, chosen from different time periods. Our method is fully unsupervised and language independent. It consists of preparing a semantic vector space for each corpus, earlier and later. Then we compute a linear transformation between earlier and later spaces, using CCA and Orthogonal Transformation. Finally, we measure the cosines between the transformed vectors. |
Práva: | Plný text je přístupný v rámci univerzity přihlášeným uživatelům. © CEUR |
Vyskytuje se v kolekcích: | Konferenční příspěvky / Conference Papers (KIV) OBD |
Soubory připojené k záznamu:
Soubor | Velikost | Formát | |
---|---|---|---|
Pražák paper110.pdf | 417,13 kB | Adobe PDF | Zobrazit/otevřít Vyžádat kopii |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/42686
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.