O korpusu KOST

Korpus slovenščine kot tujega jezika KOST je digitalna zbirka besedil, ki so jih napisali odrasli govorci, za katere slovenščina ni prvi jezik. Tovrstni korpus ponuja vpogled v slovenščino, kakršno tvorijo tisti, ki se jo še učijo kot drugi ali tuji jezik, predvsem v najpogostejše napake, ki nastajajo pri tem. Zato je KOST namenjen vsem, ki se ukvarjajo s slovenščino kot drugim ali tujim jezikom.

Kaj sestavlja KOST?

KOST trenutno obsega 835.000 besed. Besedila so v glavnem nastala na lektoratih in tečajih slovenščine kot drugega oziroma tujega jezika. Večina tvorcev teh besedil kot prvi jezik govori srbsko, bosansko in makedonsko, vključena pa so tudi besedila govorcev drugih jezikov.

Tvorci so na različnih ravneh jezikovne zmožnosti v slovenščini, od začetnikov do izpopolnjevalcev.

Prvi jeziki tvorcev

albanščina, angleščina, bosanščina, češčina, črnogorščina, francoščina, hrvaščina, italijanščina, japonščina, kirgiščina, kitajščina, korejščina, madžarščina, makedonščina, nemščina, nizozemščina, poljščina, ruščina, slovaščina, srbščina, španščina, ukrajinščina

Kontakt

Mojca Stritar Kučuk