Strategija razvoja virov in tehnologij za slovenščino

Jezikovni viri in orodja za procesiranje slovenščine

V sklopu Jezikovni viri smo nadgradili slovenske besedilne korpuse in leksikon besednih oblik. Prenovljene so bile učne množice in postopki za strojno označevanje sodobne slovenščine. Rezultat so osveženi in povečani jezikovni viri, ki so na voljo tako uporabniški skupnosti kot za strojno rabo. Z razvitimi postopki in orodji bo posodabljanje slovenskih korpusov v prihodnosti hitrejše in preprostejše.

Trajnostni načrt razvoja – Jezikovni viri

Gigafida – referenčni korpus pisne standardne slovenščine

Korpus Gigafida je temeljni podatkovni vir sodobne slovenščine in ga uporabljamo za jezikoslovne raziskave, jezikovni opis (slovarje, slovnice) in za razvoj jezikovnih tehnologij in postopkov.

Poročilo projekta Razvoj slovenščine v digitalnem okolju