FORGOT YOUR DETAILS?

Predstavitev Kolokacijskega slovarja sodobne slovenščine
in raziskovalnega projekta KOLOS

Objavljeno 10. oktobra 2018

V torek, 16. oktobra 2018, z začetkom ob 10. uri sta v Projekcijski dvorani Mestnega muzeja Ljubljana potekala dogodka, posvečena kolokacijam. Najprej so sodelavci Centra za jezikovne vire in tehnologije Univerze v Ljubljani predstavili Kolokacijski slovar sodobne slovenščine, nov jezikovni vir za slovenščino, ki v naš prostor uvaja kar nekaj novosti.

Sledil je dogodek temeljnega raziskovalnega projekta KOLOS – Kolokacije v slovenščini: semantični in časovni vidiki (ARRS J6-8255, https://www.cjvt.si/kolos/). Namen dogodka je bil seznaniti strokovno javnost s cilji in trenutnimi rezultati projekta ter opredeliti njihovo vrednost v luči primerljivih evropskih izkušenj ter nacionalnih prioritet in potreb. Projekt pripravlja nove metode in orodja za luščenje in jezikoslovno analizo kolokacij, zato so biliše posebej lepo vabljeni tisti, ki bi tovrstne podatke pri svojem delu potrebovali in uporabljali.

PROGRAM:

1. del

Kolokacijski slovar sodobne slovenščine

10:00-11:00: Predstavitev Kolokacijskega slovarja sodobne slovenščine (KSSS)

2. del

Letni dogodek projekta KOLOS

11:00-12:00 Ana Frankenberg-Garcia (University of Surrey, Velika Britanija): Bringing Collocation Prompts to Text Editors

In this talk, I will present an overview of how pedagogical dictionaries have evolved, and of some of the obstacles in the way of getting writers to become better users of today's highly sophisticated lexicographic tools and resources. Next, I will present the ColloCaid project, whose aim is to support writers with collocations from within a text editor. I will describe the rationale underlying our lexicographic coverage and visualisation decisions, and I will conclude with a demo of our initial prototype.

ColloCaid is funded by the UK Arts and Humanities Research Council grant AH/P003508/1.

12:00-12:30 Jaka Čibej (FF, IJS, FRI): Priprava učne množice za opredelitev kolokativnosti in druge dejavnosti v projektu KOLOS

Avtomatsko luščenje kolokacij temelji predvsem na izračunu statističnih sopojavitev besed v besedilnem korpusu, vsi tako izluščeni kandidati pa niso ustrezni. Da bi opredelili, kaj je legitimna statistična kolokacija na eni in slovarsko relevantna kolokacija na drugi strani, smo pripravili učno množico kolokacij, ročno razvrščenih v različne kategorije. Rezultati označevanja učne množice so uporabni ne samo za opredelitev kolokativnosti, temveč tudi za identifikacijo najpogostejših težav pri luščenju in s tem potencialnih izboljšav avtomatske metode.

12:30-13:00 Nikola Ljubešić (IJS): Frekvencija vs. semantika: što je informativnije za rangiranje kandidata kolokacija?

[Predavanje bo v hrvaščini.]

Prikazat ćemo niz eksperimenata primjene strojnog učenja na rangiranje kandidata kolokacija koje učimo na skupu podataka proizvedenom unutar projekta KOLOS. Eksperimenti su prvenstveno usmjereni na mjerenje uspješnosti rangiranja u slučaju korištenja (1) mjera supojavljivanja i (2) distribuiranog prikaza značenja riječi. Usporedit ćemo i postupke dubokog učenja s tradicionalnim metodama strojnog učenja.

13:00-13:30 Špela Arhar Holdt (FF, FRI): Kako razvrstiti kolokacije v slovarju: uporabniški pogled

Obilje jezikovnih podatkov, ki jih lahko pridobimo z računalniško podprtimi pristopi, je v priročnikih treba razvrstiti na uporabniku prijazen in intuitiven način. V predstavitvi bomo pokazali rezultate raziskave, v kateri so uporabniki kolokacijsko gradivo razvrščali glede na lastne preference – ob tem pa podali tudi opredelitev, katere te preference so.

13:30-14:00 Vprašanja in razprava

TOP

Z nadaljevanjem uporabe teh strani se strinjate z uporabo piškotkov. Več informacij

To spletno mesto uporablja tehnologijo “piškotkov” (cookies), da lahko razločujemo med obiskovalci in izvajamo statistiko uporabe spletne strani. To nam omogoča sprotno izboljševanje delovanja strani. Uporabniki, ki ne dovolijo zapisa "piškotka" naše strani v svoj računalnik, bodo ob pregledu spletne strani prikrajšani za nekatere od njenih funkcionalnosti (ogled videa, povezava do Facebooka, ipd). Piškotki so majhne datoteke, ki jih sistem obiskane spletne strani zapiše na vaš računalnik. Tako vas sistem ob naslednjem obisku strani lahko prepozna.

Na tem spletnem mestu uporabljamo naslednje vrste piškotkov:


Piškotki lastnih spletnih strani


wordpress_test_cookie: ugotovi, ali lahko vaš brskalnik sprejme piškotke. Trajanje do konca seje.

_icl_current_language: WPML piškotek, zapomni si izbiro jezika. Traja 24 ur.

euCookie: shrani odločitev uporabnika o strinjanju s piškotki.


Piškotki tretjih spletnih strani


__cfduid: 1 x licensebuttons.net, 1 x creativecommons.org - distribucija vsebin in delovanje požarnega zidu; ne shranjuje nobenih osebnih podatkov. Trajanje 5 let.

Close