Vodnik po frekvenčnih spiskih korpusov Gigafida 2.0 in GOS 1.0

Z veseljem sporočamo, da je objavljen Vodnik po frekvenčnih spiskih iz korpusov Gigafida 2.0 in GOS 1.0.

V okviru projekta “Nova slovnica sodobne standardne slovenščine: viri in metode” (ARRS J6-8256) so bili pripravljeni prosto dostopni korpusni podatki, ki so uporabni za pripravo slovničnega opisa sodobne slovenščine in razvoj novih jezikovnih tehnologij za slovenski jezik. Podatki so zasnovani empirično, torej na podlagi opazovanj, štetja ipd.

Namen publikacije je ponuditi hiter pregled podatkov, ki so na voljo na repozitoriju CLARIN, prek tega pa prikazati zmogljivosti programa LIST, ki ga je mogoče na primerljiv način uporabiti tudi na drugih besedilnih korpusih.

Vodnik predstavlja kratke izseke vseh razpoložljivih seznamov – naslovno vrstico in cca. 30 podatkovnih vrstic. Ob vsaki tabeli je na voljo povezava do podatkov v repozitoriju, na začetku vsakega podpoglavja pa kratek opis metodologije, na kateri temelji izvoz.

Publikacija je na voljo na straneh Znanstvene založbe FF v slovenščini in angleščini.

Želimo vam prijetno branje in raziskovanje!

Publikacija je nastala v okviru projekta Nova slovnica sodobne slovenščine: viri in metode (J6-8256), ki ga je sofinancirala Javna agencija za raziskovalno dejavnost Republike Slovenije iz državnega proračuna.

Več o samem projektu, rezultatih in vseh sodelujočih si lahko preberete na projektni spletni strani.