Korpus Šolar

Korpus šolskih pisnih izdelkov Šolar je korpus besedil, ki so jih učenci slovenskih osnovnih in srednjih šol samostojno tvorili pri pouku. Šolar je narejen po vzoru korpusov usvajanja jezikov, vendar pa se od večine teh korpusov razlikuje v tem, da (a) besedila niso nastala na pobudo projekta, ampak predstavljajo dejansko šolsko produkcijo učencev in dijakov, (b) so jezikovni popravki, ki so označeni v korpusu, realni, naredili pa so jih učitelji in ne raziskovalci. Zaradi izrabe učiteljskih popravkov za namene označevanja jezikovnih napak učencev je korpus edinstven ne samo v slovenskem, ampak tudi v evropskem oziroma svetovnem merilu.

Trenutna verzija Šolar 3.0 vsebuje 5.485 besedil, ki so jih napisali dijaki slovenskih srednjih šol (15-19 let) in učenci 7.-9. razreda osnovne šole, v majhnem odstotku tudi iz 6. razreda. Za vsako besedilo so navedeni podatki o šoli (osnovna ali srednja), predmet, stopnja (razred ali letnik), vrsta besedila, regija in leto izdelave. Večino korpusa predstavljajo eseji, so v pa korpusu še besedila, ki so nastala med poukom, kot so povzetki ali opisi besedil, primeri formalnih prijav ipd.

Del korpusa (2.094 besedil) je označen s popravki učiteljev po sistemu oznak, ki je opisan v smernicah za označevanje. Popravki učiteljev so bili del izvirnih datotek in odražajo resnične situacije v razredu pri ocenjevanju esejev.

Različne verzije korpusa so na voljo v repozitoriju CLARIN.SI, povezave najdete pod rubriko Podatkovne baze na naši spletni strani.

Zadnja novost, povezana s korpusom Šolar, pa je povsem novi konkordančnik, izdelan posebej za korpuse z jezikovnimi popravki. Preizkusite ga lahko tukaj.

POVEZAVE IN KONTAKT

Center za jezikovne vire in tehnologije, Univerza v Ljubljani Večna pot 113, SI-1000 Ljubljana