Online Notes (ON)
RAZVOJ SISTEMA ZA AVTOMATIZIRANO PREVAJANJE SLOVENSKIH PREDAVANJ V TUJE JEZIKE
Projekt Online Notes (ON) je namenjen razvoju sistema za avtomatizirano prevajanje slovenskih predavanj v tuje jezike. Razvoj poteka pod vodstvom Fakultete za računalništvo in informatiko Univerze v Ljubljani v sodelovanju s Centrom za jezikovne vire in tehnologije Univerze v Ljubljani. Cilj projekta je povečati dostopnost predavanj za tuje študente doma in v tujini ter za ciljne skupine s senzornimi oviranostmi.
Rezultati projekta bodo koristni za več skupin: prevodi v živo bodo tujim študentom olajšali spremljanje predavanj, ki potekajo v slovenskem jeziku; prepisi v slovenskem jeziku bodo povečali dostopnost gluhim in naglušnim; izvlečki in posnetki predavanj, ki bodo dosegljivi preko posebnega portala, pa bodo odlično dopolnjevali elektronska gradiva za študij.
Kako lahko prispevate kot predavatelji/predavateljice?
V letu 2021 smo zbirali posnetke predavanj za razvoj sistema Online Notes, ki smo ga nato uspešno uporabili v pilotnih predavanjih na štirih fakultetah (FRI, FF, FE in FDV). Vsem, ki ste pripomogli k preizkusu tako s posnetki kot s pilotnimi predavanji, se iskreno zahvaljujemo. Kratek prikaz delovanja sistema je na voljo tukaj, podrobnejše poročilo o pilotnih predavanjih pa tukaj.
V letu 2022 moramo za namen nadaljnjih izboljšav izvesti še več pilotnih predavanj z različnih področij. Predavatelje in predavateljice, ki želite sodelovati, vljudno vabimo k sodelovanju.
Za to potrebujete vsaj eno uro (avdio- ali video-)posnetkov svojih predavanj, ki jih imate v načrtu izvesti tudi v letu 2022. Še boljše je, če posnetki zajemajo vsa predavanja znotraj predmeta. Pri projektu ON posnetke namreč transkribiramo in na ta način poskrbimo, da razpoznavalnik govora čim natančneje izpisuje strokovno izrazje, ki je vezano na predmet. Z vami se bomo dogovorili za datum pilotnega predavanja, ki bo potekalo običajno in od vas ne bo zahtevalo nobenih dodatnih priprav – med njim boste le opremljeni z mikrofonom za razpoznavo govora, prisostvovala pa bo tudi tehnična ekipa projekta ON.
Zelo dobrodošlo (ne pa nujno) je, če so vaša predavanja že prevedena v angleščino (npr. s podnapisi) in lahko ob posnetkih posredujete tudi njihove prevode.
Če vas sodelovanje zanima ali če imate dodatna vprašanja, nas kontaktirajte na predavajalnik[at]cjvt.si ali neposredno Kajo Gantar (kaja.gantar[at]fri.uni-lj.si).
Zbiranje posnetkov
Center za jezikovne vire in tehnologije Univerze v Ljubljani je v okviru prve faze projekta pomagal pri množičenju zvočnih posnetkov za razvoj razpoznavalnika govora, trenutno pa s pomočjo namenskega portala za zbiranje posnetkov predavanj zbira gradivo, na katerem se algoritmi lahko naučijo pravilno razpoznavati govor v slovenskem jeziku – tj. posnetke predavanj, ki so nato transkribirani in uporabljeni za učenje razpoznavalnika. Ker se je v zadnjem obdobju po sili razmer pedagoški proces premaknil na splet, lahko k razvoju sistema ON prispevate tudi vi z deljenjem posnetkov iz vaše osebne zbirke predavanj. Junija 2021 je k prispevanju posnetkov pozval tudi rektor Univerze v Ljubljani, prof. dr. Igor Papič – poziv si lahko preberete tukaj.
Posnetki bodo uporabljeni zgolj za strojno učenje in bodo dostopni sodelavcem projekta, ki se ukvarjajo s transkripcijo govora. Če se boste strinjali z omejeno javno objavo predavanja na portalu ON, boste lahko kasneje tudi sami urejali strojno razpoznana besedila in angleške prevode. S sodelovanjem boste omogočili velik preskok pri prizadevanjih za višjo raven internacionalizacije Univerze v Ljubljani.
Kako lahko prispevate?
Na zbirnem portalu lahko oddate posnetek (video ali zvočni), tako da izpolnete obrazec in naložite datoteko, ki je lahko v kateremkoli formatu (npr. MP4, WAV), ki ga pridobimo iz orodij, ki so bila v uporabi za poučevanje na daljavo (npr. Microsoft Teams, Skype in Zoom).
Če imate na voljo večjo količino predavanj, ki so že naložena v oblak, nam lahko na info[at]cjvt.si posredujete povezave do njih, posnetke pa bomo v svoj arhiv naložili mi. Ko pošiljate povezave, ne pozabite dodati metapodatkov (vaše ime in priimek, naslov predavanja, predmet, članica UL, vaša e-pošta, telefon (opcijsko), ključne besede predavanja (ločene z vejico)), navedite pa tudi, ali se strinjate s spodnjimi pogoji ali ne.
Privolitev
Strinjam se, da Univerza v Ljubljani uporabi posnetek naloženega predavanja v okviru projekta za strojno prevajanje predavanj ON. Dostop do posnetka bodo imeli izključno sodelavci projekta za namen transkripcije govora.
Objava posnetka na portalu ON
Ali bi se v prihodnosti strinjali z objavo posnetka na portalu sistema ON? (V primeru strinjanja bi podpisali poseben dogovor o pogojih objave.)
DA
MORDA
NE
Obvestila
Želim, da me Center za jezikovne vire in tehnologije UL obvešča o novicah v zvezi s sistemom za strojno prevajanje predavanj ON.
DA
NE
EKIPA
- prof. dr. Marko Bajec (vodja projekta)
- izr. prof. dr. Iztok Lebar Bajec
- Jernej Cvek
- Mitja Rizvič
- Borut Kumperščak
- Tjaša Jelovšek
- Žan Bajec
- Arne Simonič
- dr. Simon Krek
- Kaja Gantar
- Jaka Čibej
POVEZAVE IN KONTAKT
Center za jezikovne vire in tehnologije Univerze v Ljubljani
Fakulteta za računalništvo in informatiko Univerze v Ljubljani
Večna pot 113, 1000 Ljubljana
- e-pošta: predavajalnik@cjvt.si