Izziv 1: Izboljšanje metod velikih jezikovnih modelov z jezikovnimi viri in razvoj slikovno-jezikovnih modelov
Veliki jezikovni modeli za učenje in prilagajanje določenim nalogam potrebujejo velike količine visokokakovostnih besedilnih podatkov. Takšni podatki so lahko v pomoč pri predhodnem učenju velikih jezikovnih modelov, saj je z njimi možno pripraviti različne vrste podatkov, zlasti grafe znanja in neobdelano besedilo. Informacije, ki so na voljo v leksikografskih virih, vključujejo relacije, informacije o porazdelitvi pomenov z definicijami besednih pomenov, medjezikovne povezave, identifikacijo in opis idiomatskih ali frazemov itd.
Te zakladnice informacij veliki jezikovni modeli še ne uporabljajo ustrezno, vendar bi lahko zmanjšale halucinacije, izboljšale njihovo jezikovno znanje v zapletenih situacijah in jezikih, podprtimi z manj viri, ter izboljšale doučitve jezikovnih modelov za določene pomembne naloge, kot sta zdravorazumsko sklepanje in sklepanje v naravnem jeziku.