Název: | Evaluation of Croatian Word Embeddings |
Další názvy: | Vyhodnocení slovních vektorů v chorvatštině |
Autoři: | Svoboda, Lukáš Beliga, Slobodan |
Citace zdrojového dokumentu: | TOMICZEK, P. Duffing Equation with Nonlinearities Between Eigenvalues. In: Nonlinear Analysis and Boundary Value Problems. Cham: Springer Proceedings in Mathematics & Statistics, 2019. s. 199-209. ISBN 978-3-030-26986-9, ISSN 2194-1009. |
Datum vydání: | 2018 |
Nakladatel: | Springer Proceedings in Mathematics & Statistics |
Typ dokumentu: | konferenční příspěvek conferenceObject |
URI: | http://hdl.handle.net/11025/35831 |
ISBN: | 978-3-030-26986-9 |
Klíčová slova: | korpus;chorvatština;slovní analogie;word2vec;fastText;slovní vektory;text |
Klíčová slova v dalším jazyce: | corpus;Crotatian;word analogy;word2vec;fastText;word embeddings, text |
Abstrakt: | Chorvatština je malý jazyk a patří mezi tzv. flektivní slovanské jazyky. V současné době se výzkum zaměřuje převážně na angličtinu. Vytvořili jsme proto korpus slovních analogií, který byl postaven na základě originálního korpusu pro angličtinu, jež je součástí systému Word2Vec. Navíc jsme přidali třídy specifické pouze pro slovanské jazyky. Dále jsme vytvořili chorvatské korpusy WordSim353 a RG65 pro základní vyhodnocení slovních podobností. Porovnávali jsme vytvořené datové sady se dvěma populárními modely pro slovní reprezentaci založenými na nástroji Word2Vec a fastText. Modely byly natrénovány na textovém korpusu o velikosti 1.37 miliardy slov a testovány na novém robustním korpusu slovních analogií v chorvatském jazyce. Výsledky ukazují, že modely jsou schopny vytvořit vektory se smysluplným zastoupením slov. Tento výzkum ukázal, že volné slovní pořadí a vyšší morfologická složitost chorvatského jazyka ovlivňují kvalitu výsledných slovních vektorů. |
Abstrakt v dalším jazyce: | In this article, we investigate the periodic nonlinear second order ordinary differential equation with damping u''(x) + r (x) u'(x) + g(x, u(x)) = f (x) , x ∈ [0, 2π] , u(0) = u(2π) , u'(0) = u'(2π) , where g is a L1-Caratheodory function, r ∈ C([0, 2π]), r ', f ∈ L1(0, 2π). We obtain a solution to this problem if a quotient g(x,s)/s lies between 0, 1/4+ ˜r (x) and 1/4 + ˜r (x), 1 + ˜r (x) or in interval (n^2 + ˜r (x), (n + 1)^2 + ˜r (x)), n ∈ N, where ˜ r (x) =r (x)/4+ r (x)'/2 . We use variational method and suppose that for functions u = u(x, a) satisfying lima→±∞ u(x, a) = ±∞ the function F(s) = \int_0^2π \int_0^s [−r'(x)u(x, a) + g(x,u(x, a)) − f (x) ] da dx has a critical point. |
Práva: | Plný text není přístupný. © Springer Proceedings in Mathematics & Statistics |
Vyskytuje se v kolekcích: | Konferenční příspěvky / Conference papers (RICE) Konferenční příspěvky / Conference papers (KEE) OBD |
Soubory připojené k záznamu:
Soubor | Velikost | Formát | |
---|---|---|---|
Svoboda 1111.pdf | 158,9 kB | Adobe PDF | Zobrazit/otevřít Vyžádat kopii |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/35831
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.