{"id":1162,"date":"2024-12-19T10:09:58","date_gmt":"2024-12-19T09:09:58","guid":{"rendered":"https:\/\/www.cjvt.si\/llm4dh\/?page_id=1162"},"modified":"2025-05-14T10:53:21","modified_gmt":"2025-05-14T08:53:21","slug":"cilj-3","status":"publish","type":"page","link":"https:\/\/www.cjvt.si\/llm4dh\/projektni-sklopi\/projektni-sklop-3\/","title":{"rendered":"Izziv 3: Veliki jezikovni modeli za govorjeni jezik"},"content":{"rendered":"<div class=\"flex_column av_one_full  no_margin flex_column_div av-zero-column-padding first  avia-builder-el-0  el_before_av_one_full  avia-builder-el-first  \" style='margin-top:0px; margin-bottom:30px; border-radius:0px; '><section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><h1><strong>Izziv 3: Veliki jezikovni modeli za govorjeni jezik<\/strong><\/h1>\n<\/div><\/section><\/div>\n<div class=\"flex_column av_one_full  no_margin flex_column_div av-zero-column-padding first  avia-builder-el-2  el_after_av_one_full  el_before_av_tab_section  avia-builder-el-last  column-top-margin\" style='margin-top:0px; margin-bottom:30px; border-radius:0px; '><section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><p>Veliki jezikovni modeli so zelo odvisni od podatkov. Pri rabi jezika obstajajo precej\u0161nje razlike med razli\u010dnimi vrstami diskurza. Ve\u010dina jezikovnih podatkov izhaja iz pisnih virov. Obse\u017eni viri govorjenih podatkov, \u010de so sploh dostopni za raziskave, so obi\u010dajno v lasti razli\u010dnih podjetij ali institucij in so le redko na voljo raziskovalni skupnosti. Vendar pa se ti podatki, tudi \u010de so javno dostopni, bistveno razlikujejo od govora, ki se uporablja v vsakdanjih pogovorih. Zna\u010dilnosti, kot so ohlapnej\u0161e stav\u010dne strukture, prekinjanje, motnje, molk, popravki, ponavljanja, napa\u010dna izgovorjava, pojasnjevanje, pritrjevanje, konflikti, \u017ealjivke in \u017eargon (Yeomans idr., 2023), ponazarjajo povr\u0161inske posebnosti pogovora in ka\u017eejo, da ima raziskovanje takih podatkov velik potencial vpliva na jezikovne raziskave (Love idr. 2014) ter predstavlja pomemben izziv za umetno inteligenco (Wahlster 2023). Pri tem izzivu \u017eelimo z najnovej\u0161imi metodologijami zbiranja, filtriranja, avtomatskega transkribiranja in pragmati\u010dne obdelave govornih podatkov s pomo\u010djo velikih jezikovnih modelov dose\u010di napredek v govornih tehnologijah in z njimi povezanih raziskavah.<\/p>\n<\/div><\/section><\/div>\n<\/div><\/div><\/div><!-- close content main div --><\/div><\/div><div id='av-tab-section-1'  class='av-tab-section-container entry-content-wrapper main_color av-tab-no-transition   av-tab-above-content  avia-builder-el-4  el_after_av_one_full  avia-builder-el-last  submenu-not-first container_wrap fullsize' style=' '  ><div class='av-tab-section-outer-container'><div class='av-tab-section-tab-title-container avia-tab-title-padding-default ' ><a href='#aktivnost-3.1' data-av-tab-section-title='1' class='av-section-tab-title av-active-tab-title no-scroll av-tab-no-icon av-tab-no-image  '><span class='av-outer-tab-title'><span class='av-inner-tab-title'>Aktivnost 3.1<\/span><\/span><span class='av-tab-arrow-container'><span><\/span><\/span><\/a><a href='#aktivnost-3.2' data-av-tab-section-title='2' class='av-section-tab-title  av-tab-no-icon av-tab-no-image  '><span class='av-outer-tab-title'><span class='av-inner-tab-title'>Aktivnost 3.2<\/span><\/span><span class='av-tab-arrow-container'><span><\/span><\/span><\/a><a href='#aktivnost-3.3' data-av-tab-section-title='3' class='av-section-tab-title  av-tab-no-icon av-tab-no-image  '><span class='av-outer-tab-title'><span class='av-inner-tab-title'>Aktivnost 3.3<\/span><\/span><span class='av-tab-arrow-container'><span><\/span><\/span><\/a><a href='#aktivnost-3.4' data-av-tab-section-title='4' class='av-section-tab-title  av-tab-no-icon av-tab-no-image  '><span class='av-outer-tab-title'><span class='av-inner-tab-title'>Aktivnost 3.4<\/span><\/span><span class='av-tab-arrow-container'><span><\/span><\/span><\/a><a href='#letna-poroila' data-av-tab-section-title='5' class='av-section-tab-title  av-tab-no-icon av-tab-no-image  '><span class='av-outer-tab-title'><span class='av-inner-tab-title'>Letna poro\u010dila<\/span><\/span><span class='av-tab-arrow-container'><span><\/span><\/span><\/a><\/div><div class='av-tab-section-inner-container avia-section-default' style='width:500vw; left:0%;'><span class='av_prev_tab_section av_tab_navigation'><\/span><span class='av_next_tab_section av_tab_navigation'><\/span>\n<div data-av-tab-section-content=\"1\" class=\"av-layout-tab av-animation-delay-container av-active-tab-content __av_init_open  avia-builder-el-5  el_before_av_tab_sub_section  avia-builder-el-first   \" style='vertical-align:middle; '  data-tab-section-id=\"aktivnost-3.1\"><div class='av-layout-tab-inner'><div class='container'><section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><h3><strong><em>Aktivnost <\/em><\/strong><strong><em>3.1: U\u010dinkovito zbiranje podatkov o govorjenem jeziku<\/em><\/strong><\/h3>\n<\/div><\/section><br \/>\n<section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><section class=\"av_textblock_section \">\n<div class=\"avia_textblock \">\n<p>Na voljo je nekaj podatkov o pogovornem jeziku v sloven\u0161\u010dini (Verdonik et al. 2024), vendar ne zado\u0161\u010dajo za trenutne potrebe (Love et al. 2017). Zato je razvoj sodobne in trajnostne re\u0161itve za zbiranje podatkov o pogovornem jeziku prvi izziv, s katerim se bomo ukvarjali. Zbiranje podatkov o govornem jeziku na daljavo je nujno za pridobivanje geografsko razpr\u0161enih podatkov, zlasti za jezike, ki niso angle\u0161\u010dina (Parent in Esk\u00e9nazi, 2011). Vendar pa je glavni izziv motiviranje dr\u017eavljanov za darovanje posnetkov govora. Razumevanju motivacije dr\u017eavljanov za prispevanje podatkov o govoru ali njihovemu odnosu do tehnologij, ki temeljijo na velikih jezikovnih modelih, je bilo namenjene malo pozornosti. Na\u0161 cilj je raziskati stali\u0161\u010da dr\u017eavljanov do tehnologij velikih jezikovnih modelov, ki temeljijo na govoru, ugotoviti njihove motive in vzpostaviti u\u010dinkovit spletni pristop za trajnostno zbiranje govornih podatkov.<\/p>\n<p>Uporabili bomo uspe\u0161ni platformi za mno\u017ei\u010dno zbiranje podatkov, Games-With-A-Purpose (GWAP) in Collect4NLP, ter oblikovali spletni vmesnik za zbiranje posnetkov govora, pri \u010demer bomo upo\u0161tevali ekonomske, eti\u010dne in pravne vidike ter hkrati poenostavili in avtomatizirali zbiranje metapodatkov. Nadalje bomo raziskali stali\u0161\u010da uporabnikov o tehnologijah velikih jezikovnih modelih, ki podpirajo govor, in preu\u010dili strategije za motiviranje govorcev, da prispevajo v govorne zbirke podatkov, npr. ozave\u0161\u010danje o pomenu zaupanja in zasebnosti. Uporabili bomo teorijo samoodlo\u010danja, da bi poudarili vlogo notranjih motivacij, kot so prispevanje k znanstvenim raziskavam, ohranjanje jezikovne dedi\u0161\u010dine in dru\u017ebena povezanost. Zbrani posnetki, ro\u010dne transkripcije in ve\u010dreferen\u010da transkripcija primerjalnega dela podatkov bodo javno objavljeni.<\/p>\n<\/div>\n<div class=\"avia_textblock \"><\/div>\n<\/section>\n<section class=\"av_textblock_section \">\n<div class=\"avia_textblock \"><\/div>\n<\/section>\n<\/div><\/section><br \/>\n<div class=\"flex_column av_one_fifth  flex_column_div av-zero-column-padding first  avia-builder-el-8  el_after_av_textblock  el_before_av_four_fifth  column-top-margin\" style='border-radius:0px; '><span  class=\"av_font_icon avia_animate_when_visible avia-icon-animate  av-icon-style-  av-no-color avia-icon-pos-left \" style=\"\"><span class='av-icon-char' style='font-size:40px;line-height:40px;' aria-hidden='true' data-av_icon='\ue810' data-av_iconfont='entypo-fontello' ><\/span><\/span><\/div><div class=\"flex_column av_four_fifth  flex_column_div av-zero-column-padding   avia-builder-el-10  el_after_av_one_fifth  avia-builder-el-last  column-top-margin\" style='border-radius:0px; '><section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><p><strong><em>Kazalniki 3.1: <a href=\"https:\/\/govorjena-slovenscina.um.si\/\" target=\"_blank\" rel=\"noopener\">Spletni vmesnik za zbiranje posnetkov pogovorov<\/a> (M4). Ro\u010dne transkripcije pogovorov za u\u010dni govorni korpus (5 ur) (M7). Ro\u010dne ve\u010dreferen\u010dne transkripcije za primerjalni govorni korpus (1 ura novih podatkov + 3 ure obstoje\u010dih podatkov, pridobljenih z avtomatsko prepoznavo govora) (M25). Govorni korpus s posnetki pogovorov (M36).<\/em><\/strong><\/p>\n<\/div><\/section><\/div><\/p>\n<\/div><\/div><\/div><div data-av-tab-section-content=\"2\" class=\"av-layout-tab av-animation-delay-container   avia-builder-el-12  el_after_av_tab_sub_section  el_before_av_tab_sub_section   \" style='vertical-align:middle; '  data-tab-section-id=\"aktivnost-3.2\"><div class='av-layout-tab-inner'><div class='container'><section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><h3><strong><em>Aktivnost 3.2: Semanti\u010dno in pragmati\u010dno procesiranje govora<\/em><\/strong><\/h3>\n<\/div><\/section><br \/>\n<section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><section class=\"av_textblock_section \">\n<div class=\"avia_textblock \">\n<p>Ljudje si v pogovoru razlagajo pomen na ve\u010d ravneh. Ena od klju\u010dnih ravni je namen oz. funkcija izreka. \u017de na primer preprosto vpra\u0161anje \u201eZakaj?\u201c lahko glede na kontekst razumemo ali kot zahtevo po informaciji ali kot izraz oklevanja. Teorija govornih dejanj (Austin 1975) pojasnjuje to raven pomena in je ena najvplivnej\u0161ih teorij v pragmatiki. Vendar se je izkazalo, da je za avtenti\u010dne podatke neustrezna (Levinson 2017). Zato so raziskovalci za pojem \u201egovorno dejanje\u201c razvili alternativne razlage. Opisovanje govorne rabe, zlasti pogovornega govora, z zanesljivimi, dobro uravnote\u017eenimi in ustreznimi anotacijami ter razlagami govornih dejanj in z njimi povezanih ravni pomena v kontekstu obeta bolj\u0161e razumevanje tega, kako izra\u017eamo pomen, pa tudi u\u010dinkovitej\u0161o semanti\u010dno in pragmati\u010dno procesiranje govora. S pojavom na govoru temelje\u010dih velikih jezikovnih modelov (Baevski et al. 2020; Radford et al. 2022), ki opravljajo tako ekstrakcijo kot tudi obse\u017eno interakcijo zna\u010dilnosti, je obdelava govora ob upo\u0161tevanju pragmati\u010dnih kategorij postala izvedljiva (Miah et al. 2023).<\/p>\n<p>Anotacije govornih dejanj in z njimi povezanih semanti\u010dnih ravni, zlasti izra\u017eanja sentimenta, bodo izvedene na slovenskih posnetkih pogovora, dolgih najmanj pet ur. Kriti\u010dno bomo analizirali temeljne kategorije dialo\u0161kih dejanj in njihove povezave z drugimi semanti\u010dnimi ravnmi, kot je izra\u017eanje sentimenta. Avtomatizirali bomo prepoznavanje govornih dejanj in prepoznavanje sentimenta iz govornih podatkov, pri \u010demer bomo uporabili govorno podprte velike jezikovne modele, predhodno u\u010dene tudi na sloven\u0161\u010dini, npr. XLS-R, MMS, Whisper in Seamless.<\/p>\n<\/div>\n<\/section>\n<section class=\"av_textblock_section \">\n<div class=\"avia_textblock \"><\/div>\n<\/section>\n<\/div><\/section><br \/>\n<div class=\"flex_column av_one_fifth  flex_column_div av-zero-column-padding first  avia-builder-el-15  el_after_av_textblock  el_before_av_four_fifth  column-top-margin\" style='border-radius:0px; '><span  class=\"av_font_icon avia_animate_when_visible avia-icon-animate  av-icon-style-  av-no-color avia-icon-pos-left \" style=\"\"><span class='av-icon-char' style='font-size:40px;line-height:40px;' aria-hidden='true' data-av_icon='\ue810' data-av_iconfont='entypo-fontello' ><\/span><\/span><\/div><div class=\"flex_column av_four_fifth  flex_column_div av-zero-column-padding   avia-builder-el-17  el_after_av_one_fifth  avia-builder-el-last  column-top-margin\" style='border-radius:0px; '><section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><section class=\"av_textblock_section \">\n<div class=\"avia_textblock \"><\/div>\n<\/section>\n<section class=\"av_textblock_section \">\n<div class=\"avia_textblock \">\n<p><strong><em>Kazalniki 3.2: Raz\u0161irjeni u\u010dni govorni korpus <span data-olk-copy-source=\"MessageBody\">z oznakami govornih dejanj<\/span> in sentimenta (najmanj 5 ur posnetkov pogovorov) (M10). Modeli za prepoznavanje govornih dejanj in sentimenta v govorjeni sloven\u0161\u010dini (M30).<\/em><\/strong><\/p>\n<\/div>\n<\/section>\n<\/div><\/section><\/div><\/p>\n<\/div><\/div><\/div><div data-av-tab-section-content=\"3\" class=\"av-layout-tab av-animation-delay-container   avia-builder-el-19  el_after_av_tab_sub_section  el_before_av_tab_sub_section   \" style='vertical-align:middle; '  data-tab-section-id=\"aktivnost-3.3\"><div class='av-layout-tab-inner'><div class='container'><section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><h3><strong><em>Aktivnost 3.3: Nadzor kakovosti in flitriranje govornih podatkov<\/em><\/strong><\/h3>\n<\/div><\/section><br \/>\n<section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><section class=\"av_textblock_section \">\n<div class=\"avia_textblock \">\n<p>Govorni podatki so klju\u010dni za razvoj velikih jezikovnih modelov in njihovo prilagoditev za u\u010dinkovito prepoznavanje govorjenega jezika (Prabhavalkar et al., 2023). Vendar pa je zbiranje tak\u0161nih podatkov, zlasti za jezike z manj viri, kot je sloven\u0161\u010dina, precej\u0161en izziv. Tipi\u010dna strategija vklju\u010duje pridobivanje posnetkov iz razli\u010dnih javno dostopnih medijev in preto\u010dnih platform. Ti posnetki se pogosto zelo razlikujejo glede na raznolikost govorcev, tematike, nare\u010dja in akusti\u010dna okolja ter izkazujejo \u0161irok razpon ravni kakovosti. Uporaba nefiltriranih podatkov za obse\u017eno u\u010denje modelov ali natan\u010dno prilagajanje lahko negativno vpliva na natan\u010dnost in zanesljivost modelov. Poleg tega je v skladu z na\u010deli zelene IKT, ki dajejo prednost zmanj\u0161evanju porabe energije in emisij toplogrednih plinov (Georgescu et al., 2021), neselektivna uporaba velikih podatkovnih mno\u017eic okoljsko zaskrbljujo\u010da. Zato je za u\u010dinkovito upravljanje velikih naborov podatkov o govoru nujno oceniti ustreznost podatkov pred njihovo uporabo v postopkih u\u010denja ali dou\u010ditve. Ta korak je klju\u010den tudi za ohranjanje natan\u010dnosti in zmanj\u0161evanje pristranskosti v raziskavah digitalne humanistike, ki temeljijo na jezikovnih tehnologijah. Na\u0161 cilj je razviti metode izbiranja govornih podatkov, ki bodo pove\u010dale u\u010dinkovitosti pri zbiranju in analizi govornih podatkov.<\/p>\n<p>Posnetki govorjene sloven\u0161\u010dine bodo pridobljeni iz javno dostopnih virov, npr. javno dostopnih videoposnetkov. Te podatkovne mno\u017eice zajemajo razli\u010dne govorce iz razli\u010dnih demografskih skupin. Posnetki lahko predstavljajo izzive, kot so nizka kakovost, \u0161umi v ozadju, negovorni elementi (npr. ti\u0161ina, petje, glasba), prekrivanje govora in tujejezi\u010dna vsebina. Za\u0161\u010ditili bomo govorce, ki so mladoletni ali pripadajo socialno ranljivim skupinam. Najprej bomo analizirali zna\u010dilnosti in atribute vzor\u010dnih podatkov. Ugotovljene kategorije bomo uporabili za (a) izbiro objektivnih govornih\/zvo\u010dnih metrik za nadzor kakovosti in (b) opredelitev akusti\u010dnih klasifikacij govornih posnetkov na podlagi atributov. Obe komponenti bosta vklju\u010deni v postopek predhodnega izbiranja zbranih govornih posnetkov. Razvita govorna podatkovna baza bo ocenjena s sistemom avtomatske prepoznave govora z velikimi modeli za splo\u0161ni govor.<\/p>\n<\/div>\n<\/section>\n<\/div><\/section><br \/>\n<div class=\"flex_column av_one_fifth  flex_column_div av-zero-column-padding first  avia-builder-el-22  el_after_av_textblock  el_before_av_four_fifth  column-top-margin\" style='border-radius:0px; '><span  class=\"av_font_icon avia_animate_when_visible avia-icon-animate  av-icon-style-  av-no-color avia-icon-pos-left \" style=\"\"><span class='av-icon-char' style='font-size:40px;line-height:40px;' aria-hidden='true' data-av_icon='\ue810' data-av_iconfont='entypo-fontello' ><\/span><\/span><\/div><div class=\"flex_column av_four_fifth  flex_column_div av-zero-column-padding   avia-builder-el-24  el_after_av_one_fifth  avia-builder-el-last  column-top-margin\" style='border-radius:0px; '><section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><section class=\"av_textblock_section \">\n<div class=\"avia_textblock \"><\/div>\n<\/section>\n<section class=\"av_textblock_section \">\n<div class=\"avia_textblock \">\n<p><strong><em>Kazalniki 3.3: Baza posnetkov slovenskega govora s podatki, pridobljenimi iz javno dostopnih virov (najmanj 300 ur) (M36)<\/em><\/strong><\/p>\n<\/div>\n<\/section>\n<\/div><\/section><\/div><\/p>\n<\/div><\/div><\/div><div data-av-tab-section-content=\"4\" class=\"av-layout-tab av-animation-delay-container   avia-builder-el-26  el_after_av_tab_sub_section  el_before_av_tab_sub_section   \" style='vertical-align:middle; '  data-tab-section-id=\"aktivnost-3.4\"><div class='av-layout-tab-inner'><div class='container'><section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><h3><strong><em>Aktivnost 3.4: Veliki jezikovni modeli za prepoznavo domensko specifi\u010dnega govora<\/em><\/strong><\/h3>\n<\/div><\/section><br \/>\n<section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><section class=\"av_textblock_section \">\n<div class=\"avia_textblock \">\n<p>Zagotoviti zelo natan\u010dno avtomatsko prepoznavo govora je \u0161e vedno izziv, zlasti v realnih okoljih s \u0161umom v ozadju, nagla\u0161enim govorom, preklapljanjem med jeziki\/dialekti in domensko specifi\u010dnim besedi\u0161\u010dem (Hu et al, 2024). Tradicionalni modeli avtomatske razpoznave govora imajo v tak\u0161nih razmerah pogosto te\u017eave. Vklju\u010devanje velikih jezikovnih modelov, predhodno u\u010denih na obse\u017enih besedilnih podatkih, lahko potencialno izbolj\u0161a zanesljivost avtomatske razpoznave govora, saj zaradi jezikovnega znanja omeji \u0161tevilo mo\u017enih transkripcij (Ma et al., 2024; Miao et al., 2022; Min &amp; Wang, 2023). Vendar pa u\u010dinkovito zdru\u017eevanje komponent avtomatske razpoznave govora in velikih jezikovnih modelov predstavlja raziskovalni izziv, zlasti za jezike z manj viri, ki so premalo zastopani v podatkih za predhodno u\u010denje modelov (Zhengdong et al, 2024; Hu et al, 2023b). Cilj te raziskovalne naloge je izvesti celovito primerjalno analizo za oceno u\u010dinkovitosti razli\u010dnih tehnik za povezovanje avtomatske razpoznave govora in velikih jezikovnih modelov ob upo\u0161tevanju omejitev jezikov z manj viri. Razviti \u017eelimo inovativno metodo za domensko specifi\u010dno avtomatsko razpoznavo govora, ki bo izkoristila potencial njene integracije v velike jezikovne modele in bo optimizirana za jezike z manj viri.<\/p>\n<p>Izvedli bomo obse\u017eno \u0161tudijo o povezovanju avtomatske razpoznave govora in velikih jezikovnih modelov (ki bo vklju\u010devala plitve in globoke pristope zdru\u017eevanja), nato pa izmerili u\u010dinkovitost teh metod pri delovanju avtomatske razpoznave govora in njeni zanesljivosti. Poudarek bo na a) identifikaciji pristopov, ki so najprimernej\u0161i za jezike z manj viri glede na njihove omejitve v povezavi z velikimi jezikovnimi modeli, in b) uporabnosti posameznih metod integracije avtomatske razpoznave govora v jezikovne modele pri preklapljanju domene\/konteksta (v realnem \u010dasu) brez prilagajanja modela razpoznave govora. Na podlagi rezultatov bomo razvili novo metodo za domensko specifi\u010dno prepoznavo govora, ki bo izkoristila potencial integracije avtomatske razpoznave govora v velike jezikovne modele za jezike z manj viri.<\/p>\n<\/div>\n<\/section>\n<\/div><\/section><br \/>\n<div class=\"flex_column av_one_fifth  flex_column_div av-zero-column-padding first  avia-builder-el-29  el_after_av_textblock  el_before_av_four_fifth  column-top-margin\" style='border-radius:0px; '><span  class=\"av_font_icon avia_animate_when_visible avia-icon-animate  av-icon-style-  av-no-color avia-icon-pos-left \" style=\"\"><span class='av-icon-char' style='font-size:40px;line-height:40px;' aria-hidden='true' data-av_icon='\ue810' data-av_iconfont='entypo-fontello' ><\/span><\/span><\/div><div class=\"flex_column av_four_fifth  flex_column_div av-zero-column-padding   avia-builder-el-31  el_after_av_one_fifth  avia-builder-el-last  column-top-margin\" style='border-radius:0px; '><section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><section class=\"av_textblock_section \">\n<div class=\"avia_textblock \"><\/div>\n<\/section>\n<section class=\"av_textblock_section \">\n<div class=\"avia_textblock \">\n<p><strong><em>Kazalniki 3.4: Nova metoda za integracijo domensko specifi\u010dne avtomatske razpoznave govora v velike jezikovne modele za jezike z malo viri (M36)<\/em><\/strong><\/p>\n<\/div>\n<\/section>\n<\/div><\/section><\/div><\/p>\n<\/div><\/div><\/div><div data-av-tab-section-content=\"5\" class=\"av-layout-tab av-animation-delay-container   avia-builder-el-33  el_after_av_tab_sub_section  avia-builder-el-last   \" style='vertical-align:middle; '  data-tab-section-id=\"letna-poroila\"><div class='av-layout-tab-inner'><div class='container'><section class=\"av_textblock_section \"  itemscope=\"itemscope\" itemtype=\"https:\/\/schema.org\/CreativeWork\" ><div class='avia_textblock  '   itemprop=\"text\" ><p>Click here to add your own text<\/p>\n<\/div><\/section>\n<\/div><\/div><\/div><\/div><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"","protected":false},"author":19,"featured_media":0,"parent":668,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_acf_changed":false,"_relevanssi_hide_post":"","_relevanssi_hide_content":"","_relevanssi_pin_for_all":"","_relevanssi_pin_keywords":"","_relevanssi_unpin_keywords":"","_relevanssi_related_keywords":"","_relevanssi_related_include_ids":"","_relevanssi_related_exclude_ids":"","_relevanssi_related_no_append":"","_relevanssi_related_not_related":"","_relevanssi_related_posts":"","_relevanssi_noindex_reason":"","inline_featured_image":false,"episode_type":"","audio_file":"","podmotor_file_id":"","podmotor_episode_id":"","cover_image":"","cover_image_id":"","duration":"","filesize":"","filesize_raw":"","date_recorded":"","explicit":"","block":"","itunes_episode_number":"","itunes_title":"","itunes_season_number":"","itunes_episode_type":"","footnotes":""},"class_list":["post-1162","page","type-page","status-publish","hentry"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.3 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Izziv 3: Veliki jezikovni modeli za govorjeni jezik - LLM4DH<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.cjvt.si\/llm4dh\/projektni-sklopi\/projektni-sklop-3\/\" \/>\n<meta property=\"og:locale\" content=\"sl_SI\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Izziv 3: Veliki jezikovni modeli za govorjeni jezik - LLM4DH\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.cjvt.si\/llm4dh\/projektni-sklopi\/projektni-sklop-3\/\" \/>\n<meta property=\"og:site_name\" content=\"LLM4DH\" \/>\n<meta property=\"article:modified_time\" content=\"2025-05-14T08:53:21+00:00\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data1\" content=\"12 minut\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/www.cjvt.si\\\/llm4dh\\\/projektni-sklopi\\\/projektni-sklop-3\\\/\",\"url\":\"https:\\\/\\\/www.cjvt.si\\\/llm4dh\\\/projektni-sklopi\\\/projektni-sklop-3\\\/\",\"name\":\"Izziv 3: Veliki jezikovni modeli za govorjeni jezik - LLM4DH\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.cjvt.si\\\/llm4dh\\\/#website\"},\"datePublished\":\"2024-12-19T09:09:58+00:00\",\"dateModified\":\"2025-05-14T08:53:21+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/www.cjvt.si\\\/llm4dh\\\/projektni-sklopi\\\/projektni-sklop-3\\\/#breadcrumb\"},\"inLanguage\":\"sl-SI\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/www.cjvt.si\\\/llm4dh\\\/projektni-sklopi\\\/projektni-sklop-3\\\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/www.cjvt.si\\\/llm4dh\\\/projektni-sklopi\\\/projektni-sklop-3\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/www.cjvt.si\\\/llm4dh\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Projektni sklopi\",\"item\":\"https:\\\/\\\/www.cjvt.si\\\/llm4dh\\\/projektni-sklopi\\\/\"},{\"@type\":\"ListItem\",\"position\":3,\"name\":\"Izziv 3: Veliki jezikovni modeli za govorjeni jezik\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/www.cjvt.si\\\/llm4dh\\\/#website\",\"url\":\"https:\\\/\\\/www.cjvt.si\\\/llm4dh\\\/\",\"name\":\"LLM4DH\",\"description\":\"Work site\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/www.cjvt.si\\\/llm4dh\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"sl-SI\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Izziv 3: Veliki jezikovni modeli za govorjeni jezik - LLM4DH","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.cjvt.si\/llm4dh\/projektni-sklopi\/projektni-sklop-3\/","og_locale":"sl_SI","og_type":"article","og_title":"Izziv 3: Veliki jezikovni modeli za govorjeni jezik - LLM4DH","og_url":"https:\/\/www.cjvt.si\/llm4dh\/projektni-sklopi\/projektni-sklop-3\/","og_site_name":"LLM4DH","article_modified_time":"2025-05-14T08:53:21+00:00","twitter_card":"summary_large_image","twitter_misc":{"Est. reading time":"12 minut"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/www.cjvt.si\/llm4dh\/projektni-sklopi\/projektni-sklop-3\/","url":"https:\/\/www.cjvt.si\/llm4dh\/projektni-sklopi\/projektni-sklop-3\/","name":"Izziv 3: Veliki jezikovni modeli za govorjeni jezik - LLM4DH","isPartOf":{"@id":"https:\/\/www.cjvt.si\/llm4dh\/#website"},"datePublished":"2024-12-19T09:09:58+00:00","dateModified":"2025-05-14T08:53:21+00:00","breadcrumb":{"@id":"https:\/\/www.cjvt.si\/llm4dh\/projektni-sklopi\/projektni-sklop-3\/#breadcrumb"},"inLanguage":"sl-SI","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.cjvt.si\/llm4dh\/projektni-sklopi\/projektni-sklop-3\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/www.cjvt.si\/llm4dh\/projektni-sklopi\/projektni-sklop-3\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/www.cjvt.si\/llm4dh\/"},{"@type":"ListItem","position":2,"name":"Projektni sklopi","item":"https:\/\/www.cjvt.si\/llm4dh\/projektni-sklopi\/"},{"@type":"ListItem","position":3,"name":"Izziv 3: Veliki jezikovni modeli za govorjeni jezik"}]},{"@type":"WebSite","@id":"https:\/\/www.cjvt.si\/llm4dh\/#website","url":"https:\/\/www.cjvt.si\/llm4dh\/","name":"LLM4DH","description":"Work site","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.cjvt.si\/llm4dh\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"sl-SI"}]}},"_links":{"self":[{"href":"https:\/\/www.cjvt.si\/llm4dh\/wp-json\/wp\/v2\/pages\/1162","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.cjvt.si\/llm4dh\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/www.cjvt.si\/llm4dh\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/www.cjvt.si\/llm4dh\/wp-json\/wp\/v2\/users\/19"}],"replies":[{"embeddable":true,"href":"https:\/\/www.cjvt.si\/llm4dh\/wp-json\/wp\/v2\/comments?post=1162"}],"version-history":[{"count":8,"href":"https:\/\/www.cjvt.si\/llm4dh\/wp-json\/wp\/v2\/pages\/1162\/revisions"}],"predecessor-version":[{"id":1575,"href":"https:\/\/www.cjvt.si\/llm4dh\/wp-json\/wp\/v2\/pages\/1162\/revisions\/1575"}],"up":[{"embeddable":true,"href":"https:\/\/www.cjvt.si\/llm4dh\/wp-json\/wp\/v2\/pages\/668"}],"wp:attachment":[{"href":"https:\/\/www.cjvt.si\/llm4dh\/wp-json\/wp\/v2\/media?parent=1162"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}