Plagijati u digitalnom okruženju: kako ostati autentičan?
Anja Đurđević

Aktualna pitanja vezana uz temu akademske čestitosti, uz edukaciju o važnosti poštovanja autorskog prava i pravilnog citiranja i referenciranja, prvenstveno se dotiču mehanizama sprječavanja plagijarizma te istraživanja načina na koji se manifestira u istraživačkoj i autorskoj praksi.
Dodatne izazove pritom postavlja i stalni tehnološki razvoj, preko pojave internetskih tražilica i izvora poput Wikipedije pa do danas sveprisutnih alata generativne umjetne inteligencije. Skupina na čije je navike potrebno obratiti dodatnu pozornost svakako su studenti, kao pripadnici generacije koja tehnologiju prihvaća spontano i intuitivno dok istovremeno tek usvajaju znanja vezana uz znanstvenoistraživački rad, što dodatnu podršku čini ključnom za razvoj svijesti o važnosti etičnog korištenja izvora.
Softveri za provjeru autentičnosti radova kao globalni standard
U svrhu osiguravanja autentičnosti radova, korištenje softverskih rješenja koja olakšavaju donošenje prosudbe o izvornosti danas se smatra standardom na globalnoj razini, a ovisno o njihovoj namjeni i načinu rada, koriste ih visokoškolske ustanove za provjeru studentskih seminarskih, završnih i doktorskih radova, kao i uredništva časopisa za provjeru znanstvenih i stručnih radova u sklopu uređivačkog procesa.
Opseg načina provjere na kojima se temelje takvi softveri dugi je niz godina uključivao detekciju podudarnosti i generiranje postotka sličnosti s dostupnim internetskim izvorima, znanstvenim i stručnim člancima u otvorenom pristupu i onima komercijalnih izdavača s kojima proizvođač softvera surađuje te bazom radova koji su pohranjeni prilikom korištenja softvera, čime ujedno postaju izvorima za buduće provjere. Princip rada softvera za provjeru autentičnosti radova ukratko je moguće opisati kao usporedbu teksta koji se provjerava s vanjskim izvorima te označavanje pronađenih podudaranja. Rezultati provjere prikazani su u obliku izvještaja koji softver generira, a omogućuje pregled izvora i analizu konteksta podudarajućih dijelova, uz dodatne mogućnosti filtriranja i prilagodbe.
Bitno je pritom istaknuti da konačnu odluku o tome sadrži li rad plagirane dijelove donosi korisnik nakon detaljnog pregleda izvještaja o podudarnosti, pri čemu se alat koristi samo kao pomoć prilikom donošenja prosudbe o autentičnosti, što ljudsku analizu čini neophodnim i završnim dijelom postupka provjere.

Izazovi regulacije korištenja alata generativne umjetne inteligencije
Koncept plagijarizma i obuhvat pojma danas se dodatno proširuje razvojem i širokom dostupnošću alata umjetne inteligencije (AI alata) koji generiraju različite sadržaje, uključujući i tekst. Navedene su promjene u akademskoj zajednici dovele do potrebe za raspravljanjem o konceptu i kriterijima autorstva (primjerice, može li AI alat biti naveden kao koautor) te donošenjem smjernica vezanih uz korištenje umjetne inteligencije prilikom izrade radova. Dok komercijalni izdavači znanstvenih i stručnih časopisa korištenje umjetne inteligencije danas već standardno reguliraju kroz svoje politike korištenja (npr. Elsevier donosi Generative AI policies for journals), visoka učilišta susreću se sa sličnom problematikom vezano uz korištenje takvih alata u nastavi te od studenata.
Pojam softverske provjere autentičnosti radova pritom se također proširio kako bi odgovorio na te izazove, pa su danas dostupni i dodatni alati čiji je cilj detektirati tekst koji su vjerojatno generirali alati umjetne inteligencije. Jednostavnim i ne tehničkim jezikom, takvi alati funkcioniraju na principu analize teksta uz prepoznavanje karakteristika načina pisanja, strukturiranja rečenica, izbora riječi i ostalih elemenata koji čine tekst generiran pomoću AI alata specifičnim, što se koristi kao razlikovni element u usporedbi s manje predvidivim ljudskim pisanjem. Kako je način rada takvih alata mnogo kompleksniji od dosadašnje usporedbe teksta s drugim, vanjskim dostupnim tekstovima, ključno je poznavati mogućnosti i ograničenja alata vezano uz točnost procjene. Alati takve vrste, naime, ne mogu sa sigurnošću dati prosudbu o tome je li određeni tekst ili njegov dio zaista napisan pomoću alata umjetne inteligencije, već ponajprije ukazuju na tu mogućnost.
Proizvođači takvih alata često iznose određene tvrdnje vezane uz preciznost alata (npr. Turnitinov AI writing alat prema takvim navodima daje manje od 1% lažno pozitivnih rezultata), pa je svakako preporučljivo donijeti utemeljeni sud o primjeni i korisnosti pojedinog alata nakon detaljnog testiranja i upoznavanja s njegovim mogućnostima. Pogreške u procjeni svakako su moguće, a uključuju lažno pozitivne kao i lažno negativne rezultate. Lažno pozitivno označivanje (eng. false positive), odnosi se pritom na identificiranje teksta koji je potpuno samostalno napisao čovjek kao AI generiranog, dok drugi pojam (eng. false negative) označava scenarije u kojem AI generiran tekst nije detektiran niti označen kao takav.

Srce i koordinacija korištenja softvera za provjeru autentičnosti radova za javna visoka učilišta
S ciljem postizanja sustavnog pristupa osiguravanja autentičnosti studentskih radova i podizanja svijesti o akademskoj čestitosti, Sveučilišni računski centar Sveučilišta u Zagrebu (Srce) još od 2019. godine koordinira nabavu, tehničke aspekte pristupa i korištenja te korištenje licencija softvera za provjeru autentičnosti radova za javna visoka učilišta u Hrvatskoj, pružajući edukaciju i stručnu potporu ustanovama i njihovim korisnicima. Financijska sredstva za nabavu licencija za korištenje softvera osiguralo je Ministarstvo znanosti, obrazovanja i mladih, nakon detaljnih analiza dostupnih softvera koje je provelo Srce. Danas je u sklopu licencije dostupan softver za provjeru autentičnosti radova Turnitin, trenutačno vodeći softver te namjene, koji se na tržištu dodatno pozicionirao nakon akvizicije svih većih europskih konkurenata, uključujući i softver PlagScan koji je dio ustanova prethodno koristio u sklopu Srce licencije.
Softver za provjeru autentičnosti radova namijenjen je provjeri studentskih radova, od seminarskih do završnih i doktorskih, a uključuje neograničen broj provjera koje mogu provesti sami studenti, nastavnici ili nenastavno osoblje sukladno internim procedurama svake ustanove. Kao pomoć pri korištenju, Srce je pripremilo i niz uputa za rad sa softverom na hrvatskom jeziku te svakodnevno pruža podršku administratorima ustanova za rad sa softverom Turnitin, kao i svim ostalim korisnicima, od nastavnika i nenastavnog osoblja do studenata. Vezano uz namjenu licencija, bitno je istaknuti i da zbog svog načina rada softver Turnitin nije preporučljiv za provjeru znanstvenih i stručnih radova te da licencije stoga nisu namijenjene uredništvima časopisa, koji za tu svrhu imaju izbor drugih i prikladnijih alata (primjerice, u sklopu dodatnih usluga koje urednicima nudi Crossref, posredovanjem Hrvatskog ureda za DOI).
Od početka akademske godine 2024./2025., u sklopu licencije nastavnicima i nenastavnom osoblju dostupan je i Turnitinov alat za detekciju AI generiranih tekstova kao dodatak unutar sučelja softvera. Trenutačno je dostupan isključivo za radove napisane na engleskom i španjolskom jeziku, što ustanovama i nastavnicima daje mogućnost pripreme te testiranja i upoznavanja s alatom prije šire primjene.
Više pojedinosti vezano uz licenciju i korištenje softvera, kao i upute za korisnike moguće je pronaći na stranicama Srca: Softveri za provjeru autentičnosti radova.
Primjetan porast u korištenju softvera za provjeru autentičnosti radova kroz godine pokazuje korisnost softvera te govori o ulozi koju takvi alati danas zauzimaju, jednako kao i pozitivne povratne informacije ustanova vezano uz zadovoljstvo softverom i potporom Srca, prikupljene u sklopu godišnjih anketa. Sudjelovanje ustanova pritom je ključan faktor uspješnosti, zbog čega Srce od početaka primjene potiče izradu internih pravila o korištenju, ističući važnost omogućavanja samostalne provjere radova za studente koji pritom na praktičan način razvijaju svijest o pravilnom navođenju izvora. Za cjelovitu edukaciju vezano uz navedenu temu, dostupni su i dodatni obrazovni sadržaji poput tečaja Srca: Autorstvo, plagiranje i citiranje: što, kako, zašto?
Kao dodatni faktori uspješnog pristupa sprječavanju plagijata, svakako je bitno istaknuti važnost transparentnosti i dostupnosti ocjenskih radova u otvorenom pristupu u institucijskim repozitorijima sustava Dabar, između ostalog i kako bi radovi na taj način bili dostupni softverima u ulozi vanjskih izvora za usporedbu, ali i u svrhu javne objave u skladu s načelima otvorenosti. Jednako je važna i odgovornost visokoškolskih ustanova vezana uz pravilnu primjenu softvera za provjeru autentičnosti radova i razvoja pripadajućih procedura, a isto vrijedi i za uredništva časopisa koja također trebaju voditi računa o transparentnosti primjene softvera i informiranju autora vezano uz politiku provjere autentičnosti.
Na kraju, možda je najvažnije istaknuti i vlastitu odgovornost autora koji treba osobno garantirati za autentičnost svojega rada i propisno navođenje izvora samim stvaranjem i predajom, što je posebno važno u kontekstu razgovora sa studentima kao budućim stručnim djelatnicima, ali i znanstvenicima i istraživačima. Upravo navedena osobna odgovornost izražava se već ustaljenom pozitivnom praksom prilaganja izjave autora vezane uz autentičnost i akademsku čestitost prilikom predaje ocjenskih radova kako visokoškolske ustanove nalažu. To bi danas trebalo poslužiti i kao dobar primjer kako se odnositi prema korištenju alata umjetne inteligencije pri pisanju radova, pri čemu bi vlastita izjava autora o aspektima korištenja takvih alata i etičnosti prilikom njihove upotrebe mogla biti odgovor na izazove koje postavlja razvoj tehnologije.
Ovaj tekst nastao je u sklopu projekta Pametno do informacija: knjižnična mobilna aplikacija u službi informacijske i medijske pismenosti kojeg je u 2024. godini podržalo Ministarstvo kulture i medija RH.