DS3: Kolokacijske lastnosti sinonimov
Cilji in rezultati
3.1 Analiza vloge kolokacij kot razlikovalnega elementa med sinonimi
Opravili smo analizo kolokacijskih podatkov, pripravljenih za Slovar sopomenk sodobne slovenščine (https://viri.cjvt.si/sopomenke/slv/), pri čemer smo se osredotočili na kakovost podatkov in ustreznost posameznih skladenjskih struktur. Na podlagi opravljene analize so se izdelala priporočila za izboljšavo luščenja, selekcije in prikaza kolokacijskih podatkov, vključno z nadgrajenim izborom skladenjskih struktur.
3.2 Razvoj orodja za avtomatsko prepoznavanje sinonimov
Razvili in evalvirali smo orodje za prepoznavanje sinonimnih kandidatov s pomočjo vektorskih vložitev, ki upoštevajo tudi semantične fenomene (kot so kolokacije). Orodje, učne množice in rezultate smo objavili v GitHub repozitoriju CLARIN.SI:
- Tool for synonymy identification from lemma embeddings https://github.com/clarinsi/kolosyn
3.3 Razvoj metodologije za prenos rezultatov v prakso
Dognanja iz prvih dveh delovnih sklopov smo uspešno prenesli v leksikografsko prakso, saj so kolokacije kot razlikovalni element med sinonimi sestavni del Slovarja sopomenk sodobne slovenščine (https://viri.cjvt.si/sopomenke/slv/), ki v tem pogledu predstavlja novost v slovenskem, pa tudi mednarodnem prostoru. Poleg tega smo na podlagi analize v 3.1 pripravili priporočila za izboljšave postopka priprave kolokacijskega gradiva in njegovega prikaza v vmesniku.
- Arhar Holdt, Špela; Logar, Nataša; Pori, Eva; Kosem, Iztok (2020). “Game of Words”: play the game, clean the database. V: Zoe Gavriilidou, Maria Mitsiaki in Asimakis Fliatouras (ur.): Proceedings of the 18th EURALEX International Congress, zbornik konference, str. 41–49. https://euralex2020.gr/wp-content/uploads/2020/11/EURALEX2020_ProceedingsBook-Preview.pdf. [COBISS.SI-ID 39029251]