Kako označiti sadržaj generiran umjetnom inteligencijom?

Oznake podrijetla sadržaja razuman su način prepoznavanja, a nova studija u pet zemalja istražila je koji bi izrazi bili najučinkovitiji

Mladen Smrekar utorak, 5. prosinca 2023. u 07:45
Rezultati istraživanja pokazuju da većina ljudi razumije što znači AI, ali se značenje pojmova razlikuje od zemlje do zemlje i od jezika do jezika 📷 freepik
Rezultati istraživanja pokazuju da većina ljudi razumije što znači AI, ali se značenje pojmova razlikuje od zemlje do zemlje i od jezika do jezika freepik

Krajem listopada američki predsjednik Joe Biden izdao je izvršnu naredbu (EO) koja saveznim agencijama nalaže izradu smjernica i poduzimanje akcija kojima će se jamčiti siguran, zaštićen i pouzdan razvoj i korištenje umjetne inteligencije koji uključuje i nove standarde jasnog označavanja sadržaja generiranog umjetnom inteligencijom. Taj akt najbolje pokazuje koliko je raširen strah od zloupotreba generativne AI.  

Porijeklo i autentičnost sadržaja

Ritchie Torres, američki zastupnik iz Bronxa, predložio je ove godine Zakon o otkrivanju AI-ja koji bi zahtijevao odricanje od odgovornosti (disclaimer) i obavezno označavanje bilo kojeg sadržaja koji generira AI, uključujući videozapise, fotografije, tekst ili audio, jasno vidljivim natpisom: "ovaj sadržaj generirala je umjetna inteligencija". 

Strahovanja da bi se generativna umjetna inteligencija mogla iskoristiti za manipulaciju sadržaja i širenje lažnih informacija potiče na akciju 📷 vecstock
Strahovanja da bi se generativna umjetna inteligencija mogla iskoristiti za manipulaciju sadržaja i širenje lažnih informacija potiče na akciju vecstock

Koalicija za porijeklo i autentičnost sadržaja C2PA razvila je pak otvoreni tehnički standard za praćenje podrijetla sadržaja i utvrđivanje je li njime manipulirano. Popis članova koalicije je podugačak, a u njoj se nalaze imena kao što su Microsoft, Intel, Adobe, BBC, Sony, Nikon, Canon, AWS, Shutterstock...

Disclaimeri, vodeni žigovi ili druge oznake dobar su način označavanja sadržaja, a studije su pokazale kako je manje vjerojatno da će korisnici društvenih mreža vjerovati ili dijeliti sadržaj označen kao obmanjujući. Ali prije pokušaja označavanja sadržaja koji je generirala umjetna inteligencija, platforme i kreatori politika moraju znati koji pojmovi su široko razumljivi općoj populaciji. Sve pada u vodu ako oznake koriste pretjerano žargonske ili zbunjujuće izraze.

Istraživanje u pet zemalja

Nedavno istraživanje provedeno u pet zemalja: SAD-u, Meksiku, Brazilu, Indiji i Kini, pokazalo je kako ljudi određene pojmove kao što su "proizvedeno umjetnom inteligencijom" ili "manipulirano umjetnom inteligencijom" svugdje jasno povezuju sa sadržajem stvorenim s pomoću umjetne inteligencije. Suprotno tome, oznake "deepfake" i "manipulirano" (bez spominjanja AI) najviše se povezuju s obmanjujućim sadržajem, bez obzira na to je li ga stvorila umjetna inteligencija ili ne. Ovi rezultati pokazuju da većina ljudi dobro razumije što znači AI.

Rezultati su bili slični među sudionicima, bez obzira na dob, spol, obrazovanje, digitalnu pismenost i poznavanje umjetne inteligencije. No, u oči upadaju upečatljive razlike između pojmova "manipulirano AI" i "manipulirano": jednostavno dodavanje kvalifikatora "AI" dramatično mijenja shvaćanje na koje se dijelove sadržaja taj izraz odnosi.

Svrha AI oznake

Oznake sadržaja mogu poslužiti u dvije različite svrhe; naznačiti da je sadržaj generiran s pomoću umjetne inteligencije ili pokazati da sadržaj može dovesti gledatelje u zabludu, bez obzira je li ga stvorila umjetna inteligencija ili nije. Imalo bi smisla, kažu tvorci akta, uvesti i različite oznake za obmanjujući sadržaj koji je generirala umjetna inteligencija u odnosu na sadržaj koji nije generiran umjetnom inteligencijom.

Oznake "deepfake" i "manipulirano" (bez spominjanja AI) najviše se povezuju s obmanjujućim sadržajem, bez obzira na to je li ga stvorila umjetna inteligencija ili ne 📷 freepik
Oznake "deepfake" i "manipulirano" (bez spominjanja AI) najviše se povezuju s obmanjujućim sadržajem, bez obzira na to je li ga stvorila umjetna inteligencija ili ne freepik

Bitno je i kako se oznake generiraju. Samooznačavanje ima očite nedostatke, jer će malo kreatora dobrovoljno priznati da je njihov sadržaj namjerno obmanjujući. Strojno učenje, crowdsourcing i digitalna forenzika moguće su opcije. Problem je što se sve više brišu granice između sadržaja koji stvaraju ljudi i onog koji generiraju računala. A prema načelu implicirane autentičnosti, što je više sadržaja označeno, to se više smatra da je sadržaj bez oznake stvaran.

Zbrka s pojmovima 

Konačno, istraživači su otkrili da neke oznake neće funkcionirati svugdje. Na primjer, govornici kineskog povezivali su riječ "artificial" s ljudskom uključenošću, dok taj izraz na engleskom, portugalskom i španjolskom označava automatizaciju.

"Ne možete samo uzeti oznake koje dobro funkcioniraju u Americi i slijepo ih primijeniti u drugim kulturama. Testiranje oznaka morat će se obaviti posebno u različitim zemljama kako bi se osiguralo da pojmovi svima budu jasni", zaključuju istraživači.