O PROJEKTU

Izdelava Kolokacijskega slovarja sodobne slovenščine je skupni projekt Centra za jezikovne vire in tehnologije Univerze v Ljubljani, Centra za uporabno jezikoslovje pri zavodu Trojina ter sodelavcev programske skupine »Slovenski jezik – bazične in kontrastivne raziskave« Filozofske fakultete Univerze v Ljubljani. Predstavlja del jezikovnih podatkov, potrebnih za digitalno zasnovan opis slovenske leksike v Slovarju sodobnega slovenskega jezika.

Kolokacije so najbolj pogoste in najbolj tipične besedne sopojavitve, ki odražajo naravno jezikovno rabo, kot je značilna za materne govorce. Slovar je namenjen predvsem profesionalnim piscem, kot so prevajalci in novinarji, pisateljem ter učencem slovenščine kot tujega jezika oz. vsem, ki jih zanima naravna in tipična jezikovna raba ter obnašanje besed z vidika njihovega neposrednega besedilnega okolja.

V prvi fazi je bila izdelana Baza kolokacijskega slovarja slovenskega jezika, ki vsebuje avtomatsko izluščene podatke iz korpusa besedil Gigafida, v drugi fazi je bil objavljen Kolokacijski slovar sodobne slovenščine. Za prepoznavanje kolokacij smo uporabili za slovenščino prilagojene funkcije orodja Sketch Engine. Avtomatsko izluščeni kolokacijski podatki predstavljajo prvo stopnjo v procesu izdelave celovitega kolokacijskega opisa slovenskih besed. V končni podobi bo slovar vseboval ročno pregledane podatke o kolokacijah, ki bodo urejene glede na pogostnost in jezikovno relevantnost ter opisane s kratkimi pomenskimi indikatorji ter drugimi koristnimi podatki.