Pri fizični lastnini zakonsko zaščito beležimo že od prvih ohranjenih sumerskih zakonikov dalje, torej vsaj štiri tisoč let. Koncept zaščite intelektualne lastnine je precej mlajši, saj pred izumom tiska v 15. stoletju in razsvetljenskim spodbujanjem splošne pismenosti prepisovanje misli ali idej nekako ni bilo dojeto kot problematično. Za prvi spor glede avtorskih pravic sicer velja disput med irskima menihoma iz 6. stoletja, svetim Kolumbo in svetim Finijanom. Spor naj bi nastal glede pravice do kopije knjige psalmov in naj bi se končal z razsodbo takratnega irskega vladarja, da »vsaki kravi pripada njeno tele, zato vsaki knjigi pripada njena kopija«. Nazadnje se je razvil v »bitko za knjigo«, v kateri naj bi padlo na tisoče mož. Čeprav je zgodba o izvoru spora najbrž skonstruirana, govori, da za pravico do kopiranja misli v knjižni obliki lahko padajo tudi glave.
Začetki avtorskopravne zakonodaje izhajajo manj iz želje po zaščiti avtorjev kot iz potrebe po oblastnem nadzoru, kdo lahko tiska. Za prvi avtorskopravni zakon sicer velja britanski »Statute of Anne« iz 1709. Anglo-ameriška zakonodaja se od evropske »kontinentalne« razlikuje tudi na tem področju, saj se prva bolj ukvarja s (finančnim) izkoriščanjem avtorskega dela, druga bolj ščiti avtorja kot človeka z moralnimi in materialnimi avtorskimi pravicami. Zaščita intelektualne lastnine vedno vključuje tudi tehtanje med pravico avtorja do nadzora nad svojo stvaritvijo in javnim interesom, kot je denimo prosta raba v javnem šolstvu.
Kot je znano, sta možnost digitalizacije avtorskih del, še posebej pa pojav spleta, distribucijo intelektualne lastnine obrnila na glavo. Dostop je postal neznosno lahek, kar so krepko občutili avtorji in založniki vseh mogočih del, od knjig, glasbe, filmov, novic itd. Že od začetka vzpostavitve spleta se krešejo avtorskopravne iskre med velikimi ameriškimi tehnološkimi podjetji in Evropsko unijo, ker so razlike v zakonodajah in praksah omogočale bogatenje podjetij na račun dostopa do avtorskih del na način, ki jih evropsko pravo dojema kot kršenje avtorskih pravic.
Po hudih porodnih mukah je Evropski parlament leta 2019 sprejel Direktivo o avtorski pravici na digitalnem notranjem trgu, ki bi jo morale države članice EU vključiti v svojo zakonodajo do leta 2021. Direktiva velja za zmago evropskih lastnikov avtorskih pravic nad tehnološkimi velikani. Na drugi strani je zaradi zahteve po vnaprejšnjem filtriranju avtorsko zaščitenih vsebin direktiva povzročila hudo kri na »odprti« strani spleta, kjer je denimo Wikipedija. Proti je bil tudi oče interneta Tim Berners-Lee. Nasprotniki so menili, da se splet s tem spreminja v orodje za avtomatizirano nadziranje uporabnikov in da se posredno omejuje svoboda govora, kar je seveda slabo. Spremembe slovenskih zakonov, ki implementirajo omenjeno direktivo, so bile v Državnem zboru sprejete 29. septembra letos in skrivajo nekaj pasti.
Brez pravne izjeme pri dostopu do besedil, ki so večinoma avtorskopravno zaščitena, dobrih jezikovnih tehnologij za slovenščino ne bo.
Za razvoj tehnologij za slovenski jezik, kot so strojni prevajalniki, povzemalniki, razpoznavalniki govora, klepetalniki, virtualni asistenti itd., so potrebne velike količine podatkov v slovenskem jeziku. Čim več, tem bolje. Manj jih je na voljo, slabše bodo tehnologije delovale. Na tehnološki strani se zadnjih pet let vse vrti okrog nevronskih mrež, globokega učenja in izdelave »temeljnih jezikovnih modelov«, s katerimi – poenostavljeno rečeno – ogromne količine besedil ali drugih podatkov pretvorimo v matematične vektorje, ki jih potem uporabimo za različne prej omenjene naloge. Kar v osnovi pomeni, da brez pravne izjeme pri dostopu do besedil, ki so večinoma avtorskopravno zaščitena, dobrih jezikovnih tehnologij za slovenščino ne bo. Zakon sicer vsebuje možnost uporabe del za »besedilno in podatkovno rudarjenje«, vendar moramo razumeti obseg: govorimo o dostopu do vsega, celotnega spleta v slovenskem jeziku in celotnega arhiva NUK od 16. stoletja naprej do zadnje publikacije, ki je nastala danes zjutraj. Vsega. Drugo avtorskopravno vprašanje je prav tako intrigantno – za razvoj semantičnih tehnologij nujno rabimo odprt dostop do podatkov o pomenih besed, kot so slovarji, enciklopedije, leksikoni in podobno. Še vedno edini obsežnejši slovar slovenskega jezika, SSKJ, je zaradi zakonodajnih določil v (delni) lasti avtorjev slovarja ali njihovih dedičev. Avtorji so sicer slovar dolga leta sestavljali v državni službi v socialistični ureditvi. Ker prenosa slovarja v odprt dostop ne dovolijo, smo se kot jezikovna skupnost z določili avtorske zakonodaje lepo ustrelili v nogo, saj smo kot naročnik in plačnik avtorskega dela očitno preveč pravic prenesli na drugo stran. Enako velja za Enciklopedijo Slovenije, ki je kot s strani države finančno podprt projekt obtičal v zamrznjenem avtorskopravnem vesolju neznanega števila avtorjev in njihovih dedičev. Ko bomo torej tisti, ki imamo za nalogo zagotoviti tehnološke rešitve za slovenski jezik, avtorsko zaščitene podatke odpirali, ob zavedanju, da verjetno hodimo po zakonskih robovih, bo nova zakonodaja v pomoč ali bo potrebna nova »bitka za knjigo«?
Povezava na kolumno v časniku Dnevnik