O korpusu KOST

Korpus slovenščine kot tujega jezika KOST je digitalna zbirka besedil, ki so jih napisali odrasli govorci, za katere slovenščina ni prvi jezik. Tovrstni korpus ponuja vpogled v slovenščino, kakršno tvorijo tisti, ki se jo še učijo kot drugi ali tuji jezik, predvsem v najpogostejše napake, ki nastajajo pri tem. Zato je KOST namenjen vsem, ki se ukvarjajo s slovenščino kot drugim ali tujim jezikom.

Kaj sestavlja KOST?

Trenutna različica korpusa KOST 2.0 je bila objavljena novembra 2023. KOST 2.0 obsega 1.514.476 pojavnic (8347 besedil). Besedila so v glavnem nastala na lektoratih in tečajih slovenščine kot drugega oziroma tujega jezika. Večina tvorcev teh besedil kot prvi jezik govori srbsko, bosansko in makedonsko, vključena pa so tudi besedila govorcev drugih jezikov.

Tvorci so na različnih ravneh jezikovne zmožnosti v slovenščini, od začetnikov do izpopolnjevalcev.

Prvi jeziki tvorcev

albanščina, angleščina, bolgarščina, bosanščina, češčina, črnogorščina, francoščina, grščina, hebrejščina, hrvaščina, igbo, indonezijščina, italijanščina, japonščina, kirgiščina, kiruna, kitajščina, korejščina, madžarščina, makedonščina, nemščina, nizozemščina, poljščina, portugalščina, romunščina, ruščina, slovaščina, slovenščina, srbščina, španščina, švedščina, turščina, ukrajinščina

Kontakt

Mojca Stritar Kučuk