Korpus Gigafida

Korpus Gigafida je referenčni korpus pisne slovenščine: obsežna, premišljeno zasnovana zbirka besedil, ki je ključna za raziskave jezika, jezikovni opis (slovarje, slovnice), pripravo učnih gradiv in razvoj raznovrstnih jezikovnih tehnologij ter strojnih postopkov za procesiranje slovenskega jezika. Gigafida vsebuje časopise, revije, določena spletna besedila, leposlovje, stvarno literaturo, šolske učbenike in podobna besedila.

CJVT skrbi za kakovost in dostopnost korpusa, ki mora biti vedno sodoben, zanesljivo jezikoslovno označen, pregledno dokumentiran in na voljo skupnosti za različne namene. Na drugi strani je Gigafida osnovni jezikovni vir za izdelke CJVT, kot so odzivni slovarji in leksikoni, podatkovne baze in portali. Številne izdelke smo zasnovali tako, da vsebujejo neposredne povezave na korpus – enostaven klik do primerov sodobne jezikovne rabe v širšem besedilnem kontekstu.

Nazadnje posodobljena in trenutno aktualna različica korpusa je Gigafida 2.0. Ta je bila pripravljena v projektu Nadgradnja korpusov Gigafida, Kres, ccGigafida in ccKres. Predhodne edicije so bile korpus FIDA, FidaPLUS ter Gigafida 1.0. Korpus Gigafida 2.0 lahko raziskujemo s pomočjo različnih programov: za širšo rabo je na voljo uporabniško prijazni konkordančnik CJVT; za specializirane jezikoslovne raziskave je korpus vključen tudi v NoSkeKontext, SketchEngine. O zasnovi in vsebini korpusa je mogoče več prebrati tukaj.

POVEZAVE IN KONTAKT

Center za jezikovne vire in tehnologije, Univerza v Ljubljani
Večna pot 113, SI-1000 Ljubljana