O slovenščini v digitalni dobi v podkastu Zavrti znanost!
Dr. Jaka Čibej raziskuje na stičišču jezika in tehnologije. Ukvarja se predvsem z razvojem jezikovnih virov za slovenščino, pripravo podatkov za jezikovne modele ter tudi z vprašanji varnosti, etike in odgovornega razvoja umetne inteligence.
V podkastu je poudaril, da je slovenščina danes v dobrem stanju:
“Slovenščina je danes v neprimerljivo boljšem položaju kot kadarkoli prej v zgodovini. V preteklosti nismo imeli možnosti napisati pisma Evropskemu parlamentu v slovenščini in prejeti odgovora v slovenščini. Podobno je tudi z umetno inteligenco, saj tuji veliki jezikovni modeli, kot je ChatGPT, podpirajo slovenščino.”
Njegovo delo zaobsega jezikoslovje in razvoj računalniških programov in modelov. Ob tem je izpostavil, da nove tehnologije omogočajo nove vpoglede v jezik: “Z novimi tehnologijami lahko obdelamo ogromne količine podatkov in posledično pridemo do nepričakovanih ugotovitev. Človek ne more pregledati milijarde besed naenkrat, računalnik pa lahko in zato lahko izlušči povezave, ki jih ljudje ne zaznamo.”
Pri razvoju novih tehnologij je treba upoštevati etične vidike. Veliki jezikovni modeli so (preveč) ustrežljivi in lahko dajejo odgovore na sporna vprašanja, ki so lahko škodljiva za družbo. Zato jih je potrebno naučiti, da na določena vprašanja ne odgovarjajo. Jaka Čibej je prispeval k razvoju varnostne učne množice za veliki generativni jezikovni model za slovenščino GaMS.
Prisluhnite podkastu:


