FORGOT YOUR DETAILS?

Predstavitev Kolokacijskega slovarja sodobne slovenščine
in raziskovalnega projekta KOLOS

V torek, 16. oktobra 2018, z začetkom ob 10. uri bosta v Projekcijski dvorani Mestnega muzeja Ljubljana potekala dogodka, posvečena kolokacijam. Najprej bodo sodelavci Centra za jezikovne vire in tehnologije Univerze v Ljubljani predstavili Kolokacijski slovar sodobne slovenščine, nov jezikovni vir za slovenščino, ki v naš prostor uvaja kar nekaj novosti.

Sledil bo dogodek temeljnega raziskovalnega projekta KOLOS – Kolokacije v slovenščini: semantični in časovni vidiki (ARRS J6-8255, https://www.cjvt.si/kolos/). Namen dogodka je seznaniti strokovno javnost s cilji in trenutnimi rezultati projekta ter opredeliti njihovo vrednost v luči primerljivih evropskih izkušenj ter nacionalnih prioritet in potreb. Projekt pripravlja nove metode in orodja za luščenje in jezikoslovno analizo kolokacij, zato so še posebej lepo vabljeni tisti, ki bi tovrstne podatke pri svojem delu potrebovali in uporabljali. Vljudno vabljeni!

PROGRAM:

1. del

Kolokacijski slovar sodobne slovenščine

10:00-11:00: Predstavitev Kolokacijskega slovarja sodobne slovenščine (KSSS)

2. del

Letni dogodek projekta KOLOS

11:00-12:00 Ana Frankenberg-Garcia (University of Surrey, Velika Britanija): CollocAid

[Opis bo dodan naknadno.]

12:00-12:30 Jaka Čibej (FF, IJS, FRI): Priprava učne množice za opredelitev kolokativnosti in druge dejavnosti v projektu KOLOS

Avtomatsko luščenje kolokacij temelji predvsem na izračunu statističnih sopojavitev besed v besedilnem korpusu, vsi tako izluščeni kandidati pa niso ustrezni. Da bi opredelili, kaj je legitimna statistična kolokacija na eni in slovarsko relevantna kolokacija na drugi strani, smo pripravili učno množico kolokacij, ročno razvrščenih v različne kategorije. Rezultati označevanja učne množice so uporabni ne samo za opredelitev kolokativnosti, temveč tudi za identifikacijo najpogostejših težav pri luščenju in s tem potencialnih izboljšav avtomatske metode.

12:30-13:00 Nikola Ljubešić (IJS): Frekvencija vs. semantika: što je informativnije za rangiranje kandidata kolokacija?

[Predavanje bo v hrvaščini.]

Prikazat ćemo niz eksperimenata primjene strojnog učenja na rangiranje kandidata kolokacija koje učimo na skupu podataka proizvedenom unutar projekta KOLOS. Eksperimenti su prvenstveno usmjereni na mjerenje uspješnosti rangiranja u slučaju korištenja (1) mjera supojavljivanja i (2) distribuiranog prikaza značenja riječi. Usporedit ćemo i postupke dubokog učenja s tradicionalnim metodama strojnog učenja.

13:00-13:30 Špela Arhar Holdt (FF, FRI): Kako razvrstiti kolokacije v slovarju: uporabniški pogled

Obilje jezikovnih podatkov, ki jih lahko pridobimo z računalniško podprtimi pristopi, je v priročnikih treba razvrstiti na uporabniku prijazen in intuitiven način. V predstavitvi bomo pokazali rezultate raziskave, v kateri so uporabniki kolokacijsko gradivo razvrščali glede na lastne preference – ob tem pa podali tudi opredelitev, katere te preference so.

13:30-14:00 Vprašanja in razprava

TOP

Z nadaljevanjem uporabe teh strani se strinjate z uporabo piškotkov. Več informacij >

Več informacij o zasebnosti: ZASEBNOST IN PIŠKOTKI

Naša spletna stran uporablja tehnologijo “piškotkov” (cookies), da lahko razločujemo med obiskovalci in izvajamo statistiko uporabe spletne strani. To nam omogoča sprotno izboljševanje delovanja strani. Uporabniki, ki ne dovolijo zapisa "piškotka" naše strani v svoj računalnik, bodo ob pregledu spletne strani prikrajšani za nekatere od njenih funkcionalnosti (ogled videa, povezava do Facebooka, ipd). Piškotki so majhne datoteke, ki jih sistem obiskane spletne strani zapiše na vaš računalnik. Tako vas sistem ob naslednjem obisku strani lahko prepozna.

Na naših spletnih straneh uporabljamo naslednje vrste piškotkov:

Piškotki lastnih spletnih strani

PHPSESSID: Osnovno delovanje strani, enoličen identifikator seje za prijavo uporabnika. Namen je izboljšanje delovanja spletne strani. Piškotek ne shranjuje nobenih osebnih podatkov. Trajanje do konca seje.

Sejni piškotki: služijo za shranjevanje začasnih informacij. Trajanje do konca seje.

wordpress_test_cookie: trajanje do konca seje.

_icl_current_language: WPML piškotek, zapomni si izbiro jezika. Traja 24 ur.

Piškotki tretjih spletnih strani

datr: piškotek družbenega omrežja Facebook za varnostne namene. Trajanje 2 leti,

fr: piškotek družbenega omrežja Facebook za namene oglaševanja. Trajanje 3 mesece.

reg_fb_gate: piškotek družbenega omrežja Facebook za delovanje povezave na Facebook. Trajanje za čas seje.

reg_fb_ref: piškotek družbenega omrežja Facebook za delovanje povezave na Facebook. Trajanje za čas seje.

Google Map (SID - trajanje 2 leti, SAPISID - trajanje 2 leti, APISID - trajanje 2 leti, SSID - trajanje 2 leti, HSID - trajanje 2 leti, NID - trajanje 6 mesecev, PREF - trajanje 8 mesecev): služijo za merjenje števila in za sledenje obnašanja uporabnikov Google Maps.

Skrij podrobnosti