Rezultati

Seznam rezultatov po projektih in mesecih

*Št. Naziv Nosilec Tip TRL Povezave

avgust 2024

D1.1 Prostodostopna slovenska učna množica za dialoge in ukazne zahtevke. FRI podatki 3 Dostop: GaMS-Instruct-GEN 1.0 | CLARIN.SI
D1.2 Velik jezikovni korpus za pogovorni jezik in  naslovljena terminološka področja – prva različica. FRI podatki 3 Dostop: PoVeJMo-VeMo-Med 1.0 | CLARIN.SI
D1.3 Validacijski korpus za velike jezikovne modele. FRI podatki 3 Dostop: slovenian-llm-eval | HuggingFace
D2.1 Prostodostopen velik generativni jezikovni model prilagojen dialogom in ukazom velikosti milijarde parametrov. FRI programska oprema 3 Dostop: GaMS-2B-Instruct | HuggingFace
D3.1 Učna množica z vsaj 10.000 primeri Semantika podatki 5 Dostop: GaMS-Instruct-DH 1.0 | CLARIN.SI
D4.1 Učna množica s specifičnimi dialogi in ukazi s področja medicinskih aplikacij velikosti vsaj 10.000 primerov. Better podatki (opis) 5 Dostop: GaMS-Instruct-MED 1.0 | CLARIN.SI
D5.1 Analiza možnosti uporabe govornih in jezikovnih tehnologij za izboljšanje učinkovitosti komunikacije človek-stroj v industrijskih okoljih Špica dokumentacija (opis) 5 Dostop: Analiza možnosti uporabe govornih in jezikovnih tehnologij | PDF
D5.2 Poročilo o primernosti tehnične opreme in možnih načinih integracije jezikovnih in govornih tehnologij v proizvodnih okoljih Špica dokumentacija (opis) 5 Dostop: Poročilo o primernosti tehnične opreme in možnih načinih integracije jezikovnih in govornih tehnologij v proizvodnih okoljih | PDF
D6.1 Razvit prvi načrt in pristopi za uporabo učinkovito rabo velikih jezikovnih modelov v IaC: Raba in izbor učnih podatkov, opis možnih pristopov XLAB dokumentacija (opis) 5 Dostop: Dokumentacija in načrt rabe podatkov in pristopov | PDF
D6.2 Prva različica programske opreme, ki omogoča uporabo jezikovnih tehnologij pri IaC in upošteva omejitve rabe zmogljivosti, robustnosti in varnosti XLAB programska oprema (opis) 5 Dostop: VeMo-IaC – v1 (opis) | PDF

februar 2025

D1.4 Orodja za pripravo slovarskih baz za učenje modelov in komponente za HuggingFace cevovod za integracijo odprtih slovarskih oblik. FRI programska oprema 3 Opis API-klicev za Digitalno slovarsko bazo za slovenščino:

Digital Dictionary Database of Slovene – API Routes | CJVT Wiki

Preizkus API-klicev:

Redoc

Swagger

D1.5 Namenski tokenizatorji za slovenski jezik – prva razičica. FRI programska oprema 3 Dostop:
GaMS-1B | HuggingFace (Tokenizator je vključen v model GAMS-1B, lahko pa se naloži tudi samostojno; glej datoteke tokenizer.jsontokenizer_config.json in special_tokens_map.json)
D2.2 Prostodostopen velik generativni jezikovni model prilagojen dialogom in ukazom velikosti 10 milijard parametrov. FRI programska oprema 3 Dostop: GaMS-27B-Instruct | HuggingFace
D3.2 Kalibrirani modeli SloLLaMai za humanistiko in sledenje navodilom Semantika programska oprema 5 Dostop: Micka-gen3 | HuggingFace
D4.2 Velik generativen jezikovni model, prilagojen za področje medicine. Better programska oprema 5 Dostop: Zbirka GaMS | HuggingFace (GaMS-2B, GaMS-9B, GaMS-27B – modeli, prednaučeni (tudi) s korpusom medicinskih besedil PoVeJMo-VeMo-Med 1.0)

avgust 2025

D1.6 Velik jezikovni korpus za pogovorni jezik in  naslovljena terminološka področja – druga različica. FRI podatki 4 Dostop:

GaMS-Instruct-MED 2.0 | CLARIN.SI

D2.3 Prostodostopen računsko malo zahteven generativni jezikovni model prilagojen dialogom in ukazom. FRI programska oprema 4
D3.3 Demonstracijska aplikacija za OCR Semantika programska oprema 6
D3.4 Demonstracijska aplikacija za semantično iskanje Semantika programska oprema 6
D4.3 Natančen razpoznavalnik slovenskega govora, ki bo specializiran za področje medicine. Better programska oprema 5
D5.3 Spletni servis za akustično predprocesiranje zvočnega signala in odpravo šuma Špica programska oprema 5
D5.4 Natančen in robusten večjezični model razpoznave govora za južnoslovanske jezike Špica programska oprema 5
D6.3 Dodelava načrta in popravki pristopov za učinkovito rabo velikih jezikovnih modelov v IaC: Raba in izbor učnih podatkov, opis pristopov pri gradnji XLAB dokumentacija 5
D6.4 Druga različica programske opreme, ki omogoča uporabo jezikovnih tehnologij pri IaC in upošteva omejitve rabe zmogljivosti, robustnosti in varnosti – dosežen TRL5 XLAB programska oprema 5

februar 2026

D1.7 Namenski tokenizatorji za slovenski jezik – končna razičica. FRI programska oprema 4
D2.4 Prostodostopen velik jezikovni model z vstavljenim dodatnim znanjem. FRI programska oprema 3
D3.5 Demonstracijska aplikacija za samodejno generiranje opisov zbirk Semantika programska oprema 6
D3.6 Demonstracijska aplikacija za povzemalnik Semantika programska oprema 6
D3.7 Demonstracijska aplikacija za prevajalnik Semantika programska oprema 6
D3.8 Demonstracijska aplikacija za prevajanje med navodili v naravnem jeziku in ukaznim jezikom Semantika programska oprema 6
D3.9 izdelava aplikacije za strojno ekstrakcijo entitet in izvedbo anonimizacije dokumentov, ter demonstracija na podatkovnih zbirkah Semantike Semantika programska oprema 5
D4.4 Medicinska aplikacija, ki uporablja razpoznavalnik govora in velik generativen jezikovni model. Better programska oprema 6

junij 2026

D1.8 Velik jezikovni korpus za pogovorni jezik in  naslovljena terminološka področja – končna različica. FRI podatki 4
D1.9 Baza znanja, izdelana na podlagi Digitalne slovarske baze FRI podatki 3
D3.10 Demonstracija nadgrajenega digitalnega vodiča Semantika programska oprema 6
D5.5 Prototip integracije sistema za govorno komunikacijo z izbrano rešitvijo za upravljanje s poslovnimi procesi v proizvodnji Špica programska oprema 6
D6.5 Končna različica programske opreme, ki omogoča uporabo jezikovnih tehnologij pri IaC in upošteva omejitve rabe zmogljivosti, robustnosti in varnosti – dosežen TRL6 XLAB programska oprema 6