Avtomatizirano odkrivanje semantičnih sprememb je naloga ugotavljanja in analiziranja, kako se semantični pomeni besed razlikujejo v različnih kontekstih, pogosto v več letih ali desetletjih. Čeprav je bilo v ta namen razvitih več metod, se običajno uporabljajo na majhnih, specifičnih podatkovnih množic, ki predstavljajo zlati standard (Schlechtwer et al., 2020) in se osredotočajo na nove leksikalne pomene. Težji korak nastopi, ko želimo metode prilagoditi tako, da bi do smiselnih rezultatov prišli v tistih primerih v digitalni humanistiki, kjer zaznamo le majhne nianse v spremembi pomena. Cilj te aktivnosti bo z uporabo velikih jezikovnih modelov razviti nove metode za odkrivanje semantičnih sprememb, ki bodo v digitalni humanstiki podprle diahrono analizo.
Obstoječe pristope diahrone analize, ki temeljijo na kontekstualnih vložitvah (Montariol et al., 2021), bomo razširili z generativnimi velikimi jezikovnimi modeli. Novi pristop za generiranje nadomestnih besed (Periti et al. 2024) bo prilagojen za uporabo brez doučitve. Ustvarili bomo porazdelitev verjetnih zamenjav besed, vsaka zamenjava pa bo imela „utež“, ki bo temeljila na verjetnosti generiranja besed. V nasprotju z omenjeno raziskavo (Periti et al., 2024), ki vsaki generirani besedi pripiše enako težo, bo naš pristop zaznal bolj natančne pomenske razlike. Metode bomo preizkusili na zlatem standardu za semantične spremembe za slovenščino (Pranjić et al., 2024) ter na diahronih spremembah.