Center za uporabno jezikoslovje Trojina
- korpus Šolar
- konkordančnik korpusa Šolar
- korpus Lektor
- Igra besed
- Portal jezikovnih virov
- digitalizirani slovenski pravopisi
- digitalizirane slovenske slovnice
- konkordančnik korpusa Gos
Zbiranje posnetkov
Center za jezikovne vire in tehnologije Univerze v Ljubljani je v okviru prve faze projekta pomagal pri množičenju zvočnih posnetkov za razvoj razpoznavalnika govora, trenutno pa s pomočjo namenskega portala za zbiranje posnetkov predavanj zbira gradivo, na katerem se algoritmi lahko naučijo pravilno razpoznavati govor v slovenskem jeziku – tj. posnetke predavanj, ki so nato transkribirani in uporabljeni za učenje razpoznavalnika. Ker se je v zadnjem obdobju po sili razmer pedagoški proces premaknil na splet, lahko k razvoju sistema ON prispevate tudi vi z deljenjem posnetkov iz vaše osebne zbirke predavanj. Junija 2021 je k prispevanju posnetkov pozval tudi rektor Univerze v Ljubljani, prof. dr. Igor Papič – poziv si lahko preberete tukaj.
Posnetki bodo uporabljeni zgolj za strojno učenje in bodo dostopni sodelavcem projekta, ki se ukvarjajo s transkripcijo govora. Če se boste strinjali z omejeno javno objavo predavanja na portalu ON, boste lahko kasneje tudi sami urejali strojno razpoznana besedila in angleške prevode. S sodelovanjem boste omogočili velik preskok pri prizadevanjih za višjo raven internacionalizacije Univerze v Ljubljani.
Kako lahko prispevate?
Na zbirnem portalu lahko oddate posnetek (video ali zvočni), tako da izpolnete obrazec in naložite datoteko, ki je lahko v kateremkoli formatu (npr. MP4, WAV), ki ga pridobimo iz orodij, ki so bila v uporabi za poučevanje na daljavo (npr. Microsoft Teams, Skype in Zoom).
Če imate na voljo večjo količino predavanj, ki so že naložena v oblak, nam lahko na info[at]cjvt.si posredujete povezave do njih, posnetke pa bomo v svoj arhiv naložili mi. Ko pošiljate povezave, ne pozabite dodati metapodatkov (vaše ime in priimek, naslov predavanja, predmet, članica UL, vaša e-pošta, telefon (opcijsko), ključne besede predavanja (ločene z vejico)), navedite pa tudi, ali se strinjate s spodnjimi pogoji ali ne.
Privolitev
Strinjam se, da Univerza v Ljubljani uporabi posnetek naloženega predavanja v okviru projekta za strojno prevajanje predavanj ON. Dostop do posnetka bodo imeli izključno sodelavci projekta za namen transkripcije govora.
Objava posnetka na portalu ON
Ali bi se v prihodnosti strinjali z objavo posnetka na portalu sistema ON? (V primeru strinjanja bi podpisali poseben dogovor o pogojih objave.)
DA
MORDA
NE
Obvestila
Želim, da me Center za jezikovne vire in tehnologije UL obvešča o novicah v zvezi s sistemom za strojno prevajanje predavanj ON.
DA
NE