Objavljena je prva različica semantičnega leksikona Open Slovene WordNet

Objavljena je prva različica semantičnega leksikona Open Slovene WordNet (OSWN 1.0). Odprto dostopna različica je objavljena na repozitoriju CLARIN.SI. Nastala je kot rezultat projekta SEMTEH (Povezane baze znanja za semantične tehnologije), ki je potekal na Inštitutu »Jožef Stefan«. Projekt je v okviru Javnega razpisa za (so)financiranje projektov, namenjenih gradnji in posodabljanju infrastrukture za slovenski jezik v digitalnem okolju 2023 (JR-infrastruktura-SJ-2023) financiralo Ministrstvo za kulturo Republike Slovenije.

Do leksikona lahko dostopate s klikom na spodnji  gumb.

Leksikon OSWN je jezikovni vir, ki vsebuje 95.262 sinsetov, tj. skupkov sopomenskih izrazov (literalov), ki ponazarjajo določen koncept. Literalov je skupaj 164.904, vsi pa so bili ročno pregledani. V različici 1.0 je vsak sinset opremljen tudi z angleško definicijo in njenim strojnim prevodom v slovenščino ter z medjezikovnim indeksom (Interlingual Index), preko katerega je slovenske izraze mogoče povezati z izrazi v leksikonih za druge jezike (angleški Open English WordNet, poljski plWordNet, italijanski ItalWordNet itn.). Predhodna različica slovenskega WordNeta (SloWNet 3.1) vsebuje 43.460 sinsetov in 33.000 pregledanih literalov.

Podatki iz OSWN so integrirani tudi v Digitalno slovarsko bazo za slovenščino (DDDS), ki se gradi na Centru za jezikovne vire in tehnologije Univerze v Ljubljani. Do njih je mogoče dostopati preko API-ja. Povezave med ID-ji sinsetov in ID-ji pomenov v DDDS so prav tako odprto dostopne (List of Linked Senses from Open Slovene WordNet and the Digital Dictionary Database of Slovene 1.0).

V ekipi SEMTEH-a se iskreno zahvaljujemo vsem, ki so sodelovali pri gradnji OSWN, in vabimo vse zainteresirane deležnike, da se na nas obrnejo z morebitnimi povratnimi informacijami.