Dr. Simon Krek je sodeloval na okrogli mizi Umetna inteligenca in avtorska pravica v Sloveniji: pravice avtorjev in založnikov pri razvoju slovenskih jezikovnih modelov, ki so jo organizirali pri Slovenski matici. Namen okrogle mize je bil vzpostavitev konstruktivnega dialoga s ključnimi deležniki o uporabi avtorskih del pri razvoju slovenskega velikega jezikovnega modela.
Na okrogli mizi so sodelovali: Maja Jug Hartman (Društvo slovenskih založnikov), dr. Simon Krek (Center za jezikovne vire in tehnologije UL), Janez Miš (Zbornica knjižnih založnikov in knjigotržcev), Boštjan Napotnik (avtor in kreativni direktor agencije Futura DDB) in dr. Ignacija Fridl Jarc (Slovenska matica). Pogovor je moderiral dr. Luka Novak, strokovnjak za intelektualno lastnino in član poslovodstva kolektivne organizacije SAZOR GIZ k.o.
Dr. Luka Novak je na začetku osvetlil temeljno dilemo, ki jo je naslovila okrogla miza. Razvoj velikih jezikovnih modelov, ki nastajajo tudi v slovenskem jezikovnem prostoru, temelji na masovni uporabi jezikovnih virov, med katerimi so tudi številna avtorsko varovana dela. Slednje odpira vrsto pravnih, etičnih in poslovnih vprašanj. Ob tem je dr. Novak je izpostavil, da je pomembno in nujno, da gremo v korak s časom in razvijamo velike jezikovne modele za slovenščino, vendar mora ta razvoj upoštevati pravice avtorjev in avtoric.
Dr. Simon Krek je uvodoma predstavil projekt PoVeJMo, v okviru katerega nastaja veliki jezikovni model za slovenščino. Dejal je, da po celotni Evropski uniji trenutno potekajo podobni projekti, ki odpirajo vprašanja glede uporabe jezikovnih virov in avtorskih pravic. Predstavil je tudi pobudo ALT-EDIC, katere namen je vzpostaviti evropski veliki jezikovni model, ki bo vključeval vse uradne jezike Evropske unije. V okviru pobude bodo na evropski ravni naslovljena tudi vprašanja avtorskih pravic, da bi oblikovali pravno vzdržen model za vse jezike EU.
Dr. Ignacija Fridl Jarc je v vlogi predstavnice Slovenske matice opozorila, da avtorji in avtorice nasprotujejo uporabi njihovih del za učenje velikih jezikovnih modelov: “Slovenska matica zagovarja stališče, da moramo strogo zaščititi avtorske pravice in s tem človeško ustvarjalnost kot najvišjo vrednoto.” Podobno je tudi Janez Miš opozoril, da mora biti gradnja velikih jezikovnih modelov pravična in da avtorji brezplačnemu prispevanju besedil odločno nasprotujejo.
Maja Jug Hartman je na okrogli mizi predstavila perspektivo založnikov, za katere je dejala, da je vsaka novost svojevrstna prelomnica. Izpostavila je, da avtorji niso striktno proti uporabi njihovih del, vendar je pomembno, da so dogovori o uporabi transparentni in primerno finančno ovrednoteni.
Boštjan Napotnik je opozoril, da se je pandorina skrinjica glede vprašanja avtorskih pravic odprla že z vzponom interneta 2.0 in platform za objavo uporabniško ustvarjenih vsebin. Takrat se je zmanjšala vrednost pisane besede, ker so bili uporabniki pripravljeni brezplačno deliti vsebine za grajenje družabnih mehurčkov, slednje pa je kasneje monetizirala oglaševalska industrija.
Drugi del okrogle mize je odprl vprašanje komercialne rabe velikih jezikovnih modelov. Dr. Simon Krek je pojasnil, da je vprašanje komercialne rabe postranskega pomena, ampak je ključno vprašanje, kaj se dogaja s slovenščino znotraj umetne inteligence:
“Danes odločamo o prihodnosti slovenskega jezika. Ali bo vključen v sodobna orodja umetne inteligence ali bo ostal na obrobju. Ali bodo slovenska podjetja svoje podatke pošiljala v ZDA in na Kitajsko ali pa bomo znali poskrbeti, da ti podatki ostanejo doma, tako da zgradimo lastne rešitve.”
Janez Miš, Maja Jug Hartman in dr. Ignacija Fridl Jarc so enotno izpostavili, da moramo ovrednotiti avtorsko zaščitena besedila, ki bodo vključena v učenje velikih jezikovnih modelov. Boštjan Napotnik je okroglo mizo sklenil z vizijo sodelovanja med razvijalci velikih jezikovnih modelov in imetniki avtorskih pravic.
Na Centru za jezikovne vire in tehnologije verjamemo v odprt dialog in sodelovanje. Tudi v prihodnje želimo aktivno in konstruktivno sodelovati z različnimi deležniki pri razvoju velikih jezikovnih modelov.
Celotna razprava bo kmalu na voljo na YouTube kanalu Slovenske matice.
Še vedno poteka zbiralna akcija besedil za gradnjo velikega jezikovnega modela za slovenski jezik. Vabljeni k oddaji besedil na spletni strani Povejmo.si.