Trojina Centre for Applied Linguistics
In 2022-2023, the Centre for Language Resources and Technologies took over the infrastructure activities of the Trojina Centre for Applied Linguistics, including the maintenance and upgrading of resources and tools such as:
- Šolar Corpus
- Šolar Corpus Concordancer
- Lektor corpus
- Word Game
- Language Resources Portal
- Digitised Slovenian orthographies
- Digitised Slovenian grammars
- Gos corpus concordancer
Zbiranje posnetkov
Center za jezikovne vire in tehnologije Univerze v Ljubljani je v okviru prve faze projekta pomagal pri množičenju zvočnih posnetkov za razvoj razpoznavalnika govora, trenutno pa s pomočjo namenskega portala za zbiranje posnetkov predavanj zbira gradivo, na katerem se algoritmi lahko naučijo pravilno razpoznavati govor v slovenskem jeziku – tj. posnetke predavanj, ki so nato transkribirani in uporabljeni za učenje razpoznavalnika. Ker se je v zadnjem obdobju po sili razmer pedagoški proces premaknil na splet, lahko k razvoju sistema ON prispevate tudi vi z deljenjem posnetkov iz vaše osebne zbirke predavanj. Junija 2021 je k prispevanju posnetkov pozval tudi rektor Univerze v Ljubljani, prof. dr. Igor Papič – poziv si lahko preberete tukaj.
Posnetki bodo uporabljeni zgolj za strojno učenje in bodo dostopni sodelavcem projekta, ki se ukvarjajo s transkripcijo govora. Če se boste strinjali z omejeno javno objavo predavanja na portalu ON, boste lahko kasneje tudi sami urejali strojno razpoznana besedila in angleške prevode. S sodelovanjem boste omogočili velik preskok pri prizadevanjih za višjo raven internacionalizacije Univerze v Ljubljani.
Kako lahko prispevate?
Na zbirnem portalu lahko oddate posnetek (video ali zvočni), tako da izpolnete obrazec in naložite datoteko, ki je lahko v kateremkoli formatu (npr. MP4, WAV), ki ga pridobimo iz orodij, ki so bila v uporabi za poučevanje na daljavo (npr. Microsoft Teams, Skype in Zoom).
Če imate na voljo večjo količino predavanj, ki so že naložena v oblak, nam lahko na info[at]cjvt.si posredujete povezave do njih, posnetke pa bomo v svoj arhiv naložili mi. Ko pošiljate povezave, ne pozabite dodati metapodatkov (vaše ime in priimek, naslov predavanja, predmet, članica UL, vaša e-pošta, telefon (opcijsko), ključne besede predavanja (ločene z vejico)), navedite pa tudi, ali se strinjate s spodnjimi pogoji ali ne.
Privolitev
Strinjam se, da Univerza v Ljubljani uporabi posnetek naloženega predavanja v okviru projekta za strojno prevajanje predavanj ON. Dostop do posnetka bodo imeli izključno sodelavci projekta za namen transkripcije govora.
Objava posnetka na portalu ON
Ali bi se v prihodnosti strinjali z objavo posnetka na portalu sistema ON? (V primeru strinjanja bi podpisali poseben dogovor o pogojih objave.)
DA
MORDA
NE
Obvestila
Želim, da me Center za jezikovne vire in tehnologije UL obvešča o novicah v zvezi s sistemom za strojno prevajanje predavanj ON.
DA
NE