Dr. Jaka Čibej je bil gost v oddaji Jezikanje na Valu 202. V oddaji je predstavil raziskavo, v kateri je popisal slovensko tabujevsko besedišče (kletvice, slabšalni izrazi, žaljivke in podobno). Seznam je koristen za razvoj jezikovnih iger na portalu CJVT Igre, izobraževalne namene, razvoj velikega jezikovnega modela za slovenščino GaMS in za pravno področje, ker se pravniki in sodniki sklicujejo na jezikovne vire pri razsojanju o sovražnem govoru.
Kako se Slovenci največkrat žalimo in kaj so vektorske vložitve, izveste v oddaji.
Rezultate raziskave je dr. Jaka Čibej prvič predstavil na konferenci eLex 2025. Članek z naslovom Up to No Good: Exploiting Word Embeddings for an Automatic Extraction of Candidates for a Lexicon of Slovene Taboo Language je dostopen na povezavi spodaj.

