Strategija razvoja virov in tehnologij za slovenščino
Jezikovni viri in orodja za procesiranje slovenščine
V sklopu Jezikovni viri smo nadgradili slovenske besedilne korpuse in leksikon besednih oblik. Prenovljene so bile učne množice in postopki za strojno označevanje sodobne slovenščine. Rezultat so osveženi in povečani jezikovni viri, ki so na voljo tako uporabniški skupnosti kot za strojno rabo. Z razvitimi postopki in orodji bo posodabljanje slovenskih korpusov v prihodnosti hitrejše in preprostejše.
Gigafida – referenčni korpus pisne standardne slovenščine
Korpus Gigafida je temeljni podatkovni vir sodobne slovenščine in ga uporabljamo za jezikoslovne raziskave, jezikovni opis (slovarje, slovnice) in za razvoj jezikovnih tehnologij in postopkov.