Od leta 1999, ko je UNESCO proglasil današnji dan, 21. februar, za mednarodni dan maternih jezikov, na ta dan v večini držav pozivamo k ohranjanju in zaščiti vseh jezikov. Ideja temelji na spodbujanju razumevanja, tolerance in vzpostavljanja dialoga, vendar je izvor praznovanja po stari človeški navadi precej krvav. Praznovanje je predlagala država Bangladeš kot spomin na dogodke 21. februarja 1952, ko je policija streljala na množico, ki je protestirala proti zakonom, ki so uveljavljali Urdu kot edini uradni jezik v »Vzhodnem Pakistanu« (ta je kasneje postal Bangladeš) in ubila pet demonstrantov. Večina prebivalcev kasnejšega Bangladeša je seveda govorila bengalščino, jezik, ki ima približno 250 milijonov maternih govorcev in spada med najbolj razširjene jezike na svetu.
Drugo izhodišče današnje kolumne so letošnji informativni dnevi ob vpisu v srednje šole in fakultete, ki so se končali pretekli vikend. Časopisi in spletni portali so bili spet polni podatkov o poklicih, pri katerih kadra najbolj primanjkuje ali je največ presežnega, in kot vedno smo lahko izvedeli, da na področjih, ki so vsaj od daleč povezana z jezikom, primanjkuje predvsem učiteljev za različna področja na različnih stopnjah izobraževanja, presežni pa so med drugim »prevajalci, tolmači, lektorji in drugi jezikoslovci«, tudi novinarji. Zakaj torej študirati na humanističnih ali družboslovnih fakultetah?
Kot sem v jezikolumni o jezikovnem suverenizmu opisal pred nekaj več kot mescem dni, od lanskega novembra marsikdo na področju »jezikovnega dela« umetne inteligence globoko zajema sapo. Zdaj je jasno, da se je takrat začela neusmiljena tekma med tehnološkimi giganti glede bodoče prevlade na tem področju – Microsoft konkretno vključuje ChatGPT v iskalnik Bing, ki ga preizkušajo izbrani uporabniki. Vmes se je pojavil portal you.com. Google je napovedal storitev Bard s podobno funkcionalnostjo, vendar očitno prezgodaj, saj jim je s promocijsko napovedjo in faktično napako o prvem posnetku eksoplaneta uspelo borzno vrednost podjetja Alphabet zbiti za 100 milijard dolarjev. Ta padec sicer ni pomemben v smislu realne vrednosti, precej pa govori o pomenu, ki ga tematiki velikih jezikovnih modelov, iskalnikov-klepetalnikov in podobnih tehnologij umetne inteligence pripisujejo analitiki.
V vseh do sedaj omenjenih temah se lepo prepletata dve širši dimenziji jezikovnega življenja: socialna oziroma družbeno-politična in tehnološka. Marsikdaj je sprega obeh težko ločljiva – kdo denimo lahko do konca pojasni vpliv Gutenbergovega izuma tiska s premičnimi kovinskimi črkami na možnost širjenja idej in uspeh reformacije in razsvetljenstva? Razmeroma gotovo pa se zdi že zdaj, da so na tehnološki strani globoko učenje, nevronske mreže, veliki jezikovni modeli in napredek pri digitalizaciji in umetni inteligenci vsaj napovedali spremembo, ki se ji tudi družbeno-politični del nikakor ne bo mogel izogniti.
Ali nam bo »jezikovni standard« določala umetna inteligenca, ne glede na želje pravopiscev? Ali bodo jezikovni modeli standardnega jezika »naši« slovenski, evropski ali korporativni severnoameriški?
Če miselno poeksperimentiramo in imaginacijo raztegnemo proti robovom tega, kar trenutno vemo, lahko pridemo do zanimivih idej. Ker smo dobili statistične papagaje, ki za nami neverjetno dobro ponavljajo vse, kar smo kot človeštvo že kdaj razmišljali in napisali, in to ne glede na jezik, v katerem smo to naredili (če je o njem vsaj nekaj podatkov), ni razloga, da si ne bi mogli zamisliti navodila neki bodoči verziji klepetalnika, naj enostavno napiše celo knjigo na izbrano temo v izbrani varianti latinščine ali stare grščine v slogu tega in tega avtorja. Kot eksperiment na to temo sem skušal pripraviti ChatGPT, naj ponovi zanimivo gesto Umberta Eca v romanu Ime rože in napiše prvih par imaginarnih odstavkov izgubljene druge knjige Aristotelove Poetike o komediji, za kar sem ga moral prepričevati skozi par »promptov« ali skozi pogovor prilagojenih vprašanj, ki si jih klepetalnik zapomni in reagira na celoto. Rezultat niti ni bil slab, vendarle pa je z zatekanjem k varni splošnosti še vedno dal vtis »vsevednega, preveč ustrežljivega pripravnika«. Podobno te sisteme lahko prepričujemo, da nam besedilo prevedejo, polektorirajo, povzamejo in še marsikaj drugega. In tako pridemo do bodočega poklica »prompterja«, jezikovnega delavca, ki se znajde v različnih jezikih, z različnimi jezikovnimi nalogami in ima ob sebi nikoli zaspanega robotskega pomočnika, ki je pripravljen iz sebe bruhati neskončne količine besedil.
Ta nova situacija poraja kar nekaj dilem tudi na družbeno-politični strani, denimo: ali je pomembno, da vemo, ali je neko besedilo generiral stroj ali ga je napisal človek? (V zvezi s tem se dela na tehnologijah DetectGPT.) Ali generirana in nenazadnje tudi napisana besedila dejansko kdo kdaj prebere (recimo izdane in neprebrane pesniške zbirke)? Ali je pomembno, da so napisana zgolj zato, da jih »preberejo« jezikovni modeli? Ali nam bo »jezikovni standard« določala umetna inteligenca, ne glede na želje pravopiscev? Ali bodo jezikovni modeli standardnega jezika »naši« slovenski, evropski ali korporativni severnoameriški? In še marsikaj.
O teh vprašanjih vsekakor morajo razmišljati bodoči dijaki in študenti, zelo koristno pa bi bilo, da bi o tem že zdaj razmišljali tudi ministri in ministrice, vsaj tisti za digitalno preobrazbo, za kulturo, za izobraževanje in za znanost.
Povezava na kolumno v časniku Dnevnik