Predstavitev Kolokacijskega slovarja in raziskovalnega projekta KOLOS

V torek, 16. oktobra 2018, z začetkom ob 10. uri sta v Projekcijski dvorani Mestnega muzeja Ljubljana potekala dogodka, posvečena kolokacijam. Najprej so sodelavci Centra za jezikovne vire in tehnologije Univerze v Ljubljani predstavili Kolokacijski slovar sodobne slovenščine, nov jezikovni vir za slovenščino, ki v naš prostor uvaja kar nekaj novosti.

Sledil je dogodek temeljnega raziskovalnega projekta KOLOS – Kolokacije v slovenščini: semantični in časovni vidiki (ARRS J6-8255, https://www.cjvt.si/kolos/). Namen dogodka je bil seznaniti strokovno javnost s cilji in trenutnimi rezultati projekta ter opredeliti njihovo vrednost v luči primerljivih evropskih izkušenj ter nacionalnih prioritet in potreb. Projekt pripravlja nove metode in orodja za luščenje in jezikoslovno analizo kolokacij, zato so bili še posebej lepo vabljeni tisti, ki bi tovrstne podatke pri svojem delu potrebovali in uporabljali.

Ljubljana, Mestni muzej.
Predstavitev Kolokacijskega slovarja sodobne slovenscine in raziskovalnega projekta KOLOS. Foto: STA.

Program

1. del: Kolokacijski slovar sodobne slovenščine

10:00-11:00: Predstavitev Kolokacijskega slovarja sodobne slovenščine (KSSS)


2. del: Letni dogodek projekta KOLOS

11:00-12:00 Ana Frankenberg-Garcia (University of Surrey, Velika Britanija): CollocAid

[Predavanje bo v angleščini.]

Bringing Collocation Prompts to Text Editors

Dictionaries have seen dramatic improvements over the past decades. Paper dictionaries focussing primarily on the meanings of words have evolved into portable electronic devices that can also help language users improve their writing. Collocation dictionaries are particularly useful in this respect, as they help writers find words that are conventionally used in combination with each other, like design+system, or successfully+achieve or purely +practical. While there are now a number readily available collocation dictionaries or general language dictionaries that contain information on collocation (at least for English!), many writers do not consult them as often as they should. The problem is not only one of collocation error. Writers may overuse certain collocations and underuse others, or they may even abandon what they were initially trying to say because they cannot find the words they need. Our solution to the problem is to bring collocation prompts to a text editor, so that writers can gain lexical assistance as and when required.

In this talk, I will present an overview of how pedagogical dictionaries have evolved, and of some of the obstacles in the way of getting writers to become better users of today’s highly sophisticated lexicographic tools and resources. Next, I will present the ColloCaid project, whose aim is to support writers with collocations from within a text editor. I will describe the rationale underlying our lexicographic coverage and visualisation decisions, and I will conclude with a demo of our initial prototype.

ColloCaid is funded by the UK Arts and Humanities Research Council grant AH/P003508/1


12:00-12:30 Jaka Čibej (FF, IJS, FRI): Priprava učne množice za opredelitev kolokativnosti in druge dejavnosti v projektu KOLOS

Avtomatsko luščenje kolokacij temelji predvsem na izračunu statističnih sopojavitev besed v besedilnem korpusu, vsi tako izluščeni kandidati pa niso ustrezni. Da bi opredelili, kaj je legitimna statistična kolokacija na eni in slovarsko relevantna kolokacija na drugi strani, smo pripravili učno množico kolokacij, ročno razvrščenih v različne kategorije. Rezultati označevanja učne množice so uporabni ne samo za opredelitev kolokativnosti, temveč tudi za identifikacijo najpogostejših težav pri luščenju in s tem potencialnih izboljšav avtomatske metode.


12:30-13:00 Nikola Ljubešić (IJS): Frekvencija vs. semantika: što je informativnije za rangiranje kandidata kolokacija?

[Predavanje bo v hrvaščini.]

Prikazat ćemo niz eksperimenata primjene strojnog učenja na rangiranje kandidata kolokacija koje učimo na skupu podataka proizvedenom unutar projekta KOLOS. Eksperimenti su prvenstveno usmjereni na mjerenje uspješnosti rangiranja u slučaju korištenja (1) mjera supojavljivanja i (2) distribuiranog prikaza značenja riječi. Usporedit ćemo i postupke dubokog učenja s tradicionalnim metodama strojnog učenja.


13:00-13:30 Špela Arhar Holdt (FF, FRI): Kako razvrstiti kolokacije v slovarju: uporabniški pogled

Obilje jezikovnih podatkov, ki jih lahko pridobimo z računalniško podprtimi pristopi, je v priročnikih treba razvrstiti na uporabniku prijazen in intuitiven način. V predstavitvi bomo pokazali rezultate raziskave, v kateri so uporabniki kolokacijsko gradivo razvrščali glede na lastne preference – ob tem pa podali tudi opredelitev, katere te preference so.


13:30-14:00
 Vprašanja in razprava