Vabljeni predavanji o digitalnih orodjih za slovenščino v Srbiji

Raziskovalec Nejc Robida je v Beogradu izvedel vabljeni predavanji na Društvu Slovencev “Sava” in na Oddelku za splošno jezikoslovje.  

 V predavanju Digitalni svet slovenščine je predstavil orodja za slovenski jezik, ki so nastala na Centru za jezikovne vire in tehnologije Univerze v Ljubljani. Udeležence je seznanil s korpusoma Gigafida in GOS ter leksikonom Sloleks. Korpus Gigafida vsebuje časopise, revije, določena spletna besedila, leposlovje, stvarno literaturo, šolske učbenike in podobna besedila. Gos je referenčni korpus govorjene slovenščine. Obsega transkripcije okrog 320 ur posnetkov (po)govora v najrazličnejših situacijah, ki smo jim izpostavljeni vsak dan: od radijskih in televizijskih oddaj prek šolskih ur in predavanj do zasebnih pogovorov med prijatelji. Sloleks je leksikon besednih oblik za slovenski jezik. V strukturirani bazi podatkov vsebuje osnovne podatke o slovenskih besedah, predvsem v katero besedno vrsto spadajo in kakšne so njihove slovnične lastnosti. 

V drugem delu predavanja je sledila ponazoritev uporabe digitalnih orodij v praksi. Nejc Robida namreč v doktorski raziskavi z računalniškimi metodami analizira govorne posnetke in odkriva jezikovne posebnosti. Prikazal je razvoj računalniškega modela za prepoznavo naglasov v slovenščini. Računalniški model predstavlja temelj za pridobivanje zanesljivih prozodičnih lastnosti govorjene slovenščine, ki bodo vključene v Digitalno slovarsko bazo za slovenščino.