Projektni okvir
V projektu “Prilagodljiva obdelava naravnega jezika s pomočjo Velikih Jezikovnih Modelov ” oz. PoVeJMo bo ustvarjenih več računsko učinkovitih odprtodostopnih velikih jezikovnih modelov za slovenščino. Projekt se ukvarja z obdelavo naravnega jezika, umetno inteligenco, govornimi in semantičnimi tehnologijami.
Namen projekta
Zgrajen bo odprtodostopen model SloLLaMa, prvi tak model za morfološko bogat jezik z malo viri. Pripravili bomo korpus za sledenje ukazom, ki bo osnova za nadaljne prilagoditve modela SloLLaMa specifičnim potrebam aplikacij, na voljo pa bo tudi za širšo akademsko in industrijsko rabo.
V aplikativnih projektih bomo osnovni model SloLLaMa prilagajali na naslednje načine.
1) Za pripravo predstavitvenih gradiv in predstavitve podatkov v muzejski rabi ter za napredne muzejske interaktivne aplikacije.
2) Za uporabo pri prepoznavanju in sintezi slovenskega govora, kjer bomo z računsko učinkovito inačico modela SloLLaMa omogočili integracijo govornih tehnologij v napredne industrijske aplikacije.
3) Za uporabo v medicini, kjer bomo model SloLLaMa prilagodili z medicinskimi besedili in ukazi s področja klinične in ambulantne rabe.
4) Za uporabo pri generiranju infrastrukturne kode, kjer bomo tehnologije za računsko učinkovite velike jezikovne modele in razvite cevovode za izgradnjo ukaznih in dialoških učnih množic uporabili za generiranje opisa računalniške infrastrukture v programski kodi.
Poleg aplikacij bo projekt zgradil še temeljno infrastrukturo za aplikacije umetne inteligence v slovenščini ter razvil rešitve, ki bodo koristne za druge jezike z malo viri.
Konzorcij
Pri projektu sodeluje osem konzorcijskih partnerjev, in sicer tri javne raziskovalne organizacije ter pet podjetij:
- Univerza v Ljubljani, Fakulteta za računalništvo in informatiko
- Znanstvenoraziskovalni center Slovenske akademije znanosti in umetnosti
- Inštitut za novejšo zgodovino
- Semantika d.o.o.
- XLAB d.o.o.
- Vitasis d.o.o.
- BETTER, d.o.o.
- ŠPICA INTERNATIONAL d.o.o. Ljubljana
Časovni okvir
Projekt poteka v štirih fazah:
- FAZA 1: Industrijske raziskave
- FAZA 2: Razvoj
- FAZA 3: Demonstracija in pilotiranje
- FAZA 4: Pilotiranje