O PROJEKTU

Sopomenke in Kolokacije 2.0 – SoKol

Nadgradnja temeljnih slovarskih virov in podatkovnih baz CJVT UL

Projekt naslavlja dva temeljna gradnika digitalne jezikovne infrastrukture za slovenščino: Slovar sopomenk sodobne slovenščine in Kolokacijski slovar sodobne slovenščine. Slovarja sta trenutno dostopna v različici 1.0. Namen projekta je nadgraditi oba slovarja v različico 2.0 in ju objaviti tako v slovarskem vmesniku kot tudi v obliki odprto dostopne slovarske baze na repozitoriju CLARIN.SI. Rezultati bodo na voljo v zadnjih mesecih leta 2022.

Resolucija o nacionalnem programu za jezikovno politiko 2021–2025 Slovar sopomenk sodobne slovenščine in Kolokacijski slovar sodobne slovenščine našteva med večjimi dosežki iz obdobja 2014–2018, ko je Slovenija na področju jezikovne opremljenosti prepoznala izzive, ki zahtevajo hitro in učinkovito ukrepanje. Slovarja namreč vpeljujeta koncept t. i. odzivnega slovarja, ki zagotavlja hiter dostop do odprtih podatkov o sodobni jezikovni rabi: odzivni slovarji so pripravljeni strojno in v tej obliki takoj dostopni za vse, sledi postopno jezikoslovno pregledovanje in urejanje, pri katerem lahko sodeluje tudi širša skupnost.

Ker odzivni slovarji temeljijo na rednem posodabljanju, smo s pomočjo uporabniških anket, intervjujev in evalvacij opredelili prioritete skupnosti glede prvih nadgradenj Slovarja sopomenk in Kolokacijskega slovarja.

V Slovar sopomenk lahko predloge sopomenk vpisujejo tudi uporabniki, zato bomo poskrbeli za preglednejše in hitrejše uredniške protokole. V slovar bomo dodali tudi razdelek za protipomenke. V Kolokacijskem slovarju bomo razvili možnosti za napredno iskanje po večbesednih slovarskih informacijah. V slovarja želimo dodati kvalifikatorje, prioritetno pri sovražnem in slabšalnem besedišču. Pri teh iztočnicah bomo pregledali tudi zglede rabe, ki so avtomatsko uvoženi iz korpusa. Nenazadnje bomo pri obeh slovarjih vsaj 2.000 slovarskih gesel opremili z informacijo o pomenu in razvrstili sopomenke ter kolokacije pod ustrezne pomenske indikatorje.

Projekt financira Ministrstvo za kulturo Republike Slovenije kot del Javnega razpisa za (so)financiranje projektov, namenjenih gradnji in posodabljanju infrastrukture za slovenski jezik v digitalnem okolju 2021–2022.