Online Notes (ON)
RAZVOJ SISTEMA ZA AVTOMATIZIRANO PREVAJANJE SLOVENSKIH PREDAVANJ V TUJE JEZIKE
Projekt Online Notes (ON) je namenjen razvoju sistema za avtomatizirano prevajanje slovenskih predavanj v tuje jezike. Razvoj poteka pod vodstvom Fakultete za računalništvo in informatiko Univerze v Ljubljani v sodelovanju s Centrom za jezikovne vire in tehnologije Univerze v Ljubljani. Cilj projekta je povečati dostopnost predavanj za tuje študente doma in v tujini ter za ciljne skupine s senzornimi oviranostmi.
Rezultati projekta bodo koristni za več skupin: prevodi v živo bodo tujim študentom olajšali spremljanje predavanj, ki potekajo v slovenskem jeziku; prepisi v slovenskem jeziku bodo povečali dostopnost gluhim in naglušnim; izvlečki in posnetki predavanj, ki bodo dosegljivi preko posebnega portala, pa bodo odlično dopolnjevali elektronska gradiva za študij.
Pilotna predavanja
V okviru projekta Online Notes je bilo v letih 2021, 2022 in 2023 skupno izvedenih 33 pilotnih predavanj na 12 članicah Univerze v Ljubljani.
V okviru projekta Online Notes je bilo v letih 2021, 2022 in 2023 skupno izvedenih 33 pilotnih predavanj na 12 članicah Univerze v Ljubljani.
V drugi polovici leta 2021 je bilo izvedenih pet pilotnih predavanj na štirih fakultetah (FRI, FF, FDV, FE).
V letu 2022 je bilo izvedenih 12 pilotnih predavanj na osmih fakultetah (FSD, PF, BF, FDV, VF, FGG, FRI, FE).
V letu 2023 je bilo izvedenih 16 pilotnih predavanj na devetih fakultetah (FGG, PF, FKKT, BF, PEF, FF, FS, FMF, VF).
Vsem, ki ste pripomogli k preizkusu tako s posnetki kot s pilotnimi predavanji, se iskreno zahvaljujemo. Kratek prikaz delovanja sistema je na voljo tukaj.
Če imate dodatna vprašanja, nas kontaktirajte na predavajalnik[at]cjvt.si.
Zbiranje posnetkov
Center za jezikovne vire in tehnologije Univerze v Ljubljani je v okviru prve faze projekta pomagal pri množičenju zvočnih posnetkov za razvoj razpoznavalnika govora, trenutno pa s pomočjo namenskega portala za zbiranje posnetkov predavanj zbira gradivo, na katerem se algoritmi lahko naučijo pravilno razpoznavati govor v slovenskem jeziku – tj. posnetke predavanj, ki so nato transkribirani in uporabljeni za učenje razpoznavalnika. Ker se je v zadnjem obdobju po sili razmer pedagoški proces premaknil na splet, lahko k razvoju sistema ON prispevate tudi vi z deljenjem posnetkov iz vaše osebne zbirke predavanj. Junija 2021 je k prispevanju posnetkov pozval tudi rektor Univerze v Ljubljani, prof. dr. Igor Papič – poziv si lahko preberete tukaj.
Posnetki bodo uporabljeni zgolj za strojno učenje in bodo dostopni sodelavcem projekta, ki se ukvarjajo s transkripcijo govora. Če se boste strinjali z omejeno javno objavo predavanja na portalu ON, boste lahko kasneje tudi sami urejali strojno razpoznana besedila in angleške prevode. S sodelovanjem boste omogočili velik preskok pri prizadevanjih za višjo raven internacionalizacije Univerze v Ljubljani.
Kako lahko prispevate?
Na zbirnem portalu lahko oddate posnetek (video ali zvočni), tako da izpolnete obrazec in naložite datoteko, ki je lahko v kateremkoli formatu (npr. MP4, WAV), ki ga pridobimo iz orodij, ki so bila v uporabi za poučevanje na daljavo (npr. Microsoft Teams, Skype in Zoom).
Če imate na voljo večjo količino predavanj, ki so že naložena v oblak, nam lahko na info[at]cjvt.si posredujete povezave do njih, posnetke pa bomo v svoj arhiv naložili mi. Ko pošiljate povezave, ne pozabite dodati metapodatkov (vaše ime in priimek, naslov predavanja, predmet, članica UL, vaša e-pošta, telefon (opcijsko), ključne besede predavanja (ločene z vejico)), navedite pa tudi, ali se strinjate s spodnjimi pogoji ali ne.
Privolitev
Strinjam se, da Univerza v Ljubljani uporabi posnetek naloženega predavanja v okviru projekta za strojno prevajanje predavanj ON. Dostop do posnetka bodo imeli izključno sodelavci projekta za namen transkripcije govora.
Objava posnetka na portalu ON
Ali bi se v prihodnosti strinjali z objavo posnetka na portalu sistema ON? (V primeru strinjanja bi podpisali poseben dogovor o pogojih objave.)
DA
MORDA
NE
Obvestila
Želim, da me Center za jezikovne vire in tehnologije UL obvešča o novicah v zvezi s sistemom za strojno prevajanje predavanj ON.
DA
NE
EKIPA
- prof. dr. Marko Bajec (vodja projekta)
- dr. Simon Krek
- izr. prof. dr. Iztok Lebar Bajec
- Tjaša Šoltes
- Jernej Cvek
- Mitja Rizvič
- Kaja Gantar
- dr. Jaka Čibej
- Sara Sever
- dr. Robert Rozman
POVEZAVE IN KONTAKT
Center za jezikovne vire in tehnologije Univerze v Ljubljani
Fakulteta za računalništvo in informatiko Univerze v Ljubljani
Večna pot 113, 1000 Ljubljana
- e-pošta: predavajalnik@cjvt.si