Informacijsko ratovanje - Facebooku Kako napaćenom narodu učinkovito isporučiti lažnu vijest?
U jeku afere vezane uz tvrtku Cambridge Analytica, donosimo presjek prvog javnog istraživanja domaćih Facebook stranica, baziranog na korištenju SNA tehnika (Social Network Analysis) te posljedične vizualizacije podataka
U vrijeme provođenja istraživanja (jesen/zima 2017.-2018.) koje će na narednim stranicama biti prezentirano, u hrvatskim medijima pojavio se i ubrzo postao izrazito popularan pojam “hibridno ratovanje”, baš kao i termin koji predstavlja jedan njegov segment, a to je informacijsko ratovanje. Ne radi se ni o kakvim novim konstruktima, već o poprilično poznatim stvarima koje su razvojem Interneta i društvenih mreža svoje mjesto našle i u mainstream medijima.
Upravljanje tijekom informacija
Definicija informacijskog ratovanja, prema mišljenju Ministarstva obrane SAD-a, ide u prilog tome da se radi o procesu koji omogućuje upravljanje tijekom informacija kako bi se postigli određeni ciljevi u odnosu na određenog protivnika te istodobno njega onemogućilo da to isto čini nama.
S druge strane, velika količina podataka koja se generira radom društvenih mreža može biti zanimljiva za različite vrste analiza, no ono po čemu su takve mreže najzanimljivije, svakako jest činjenica da kreiraju podatke o socijalnim interakcijama, što nam u pogledu ranije opisanog informacijskog prostora svakako može biti od koristi da shvatimo što se u našoj interesnoj sferi zapravo događa. U tom pogledu podaci o socijalnim interakcijama zapravo su relacijski podaci, odnosno podaci koji nam govore tko s kim komunicira, tko su prijatelji, tko ima slične interese, a na temelju takvih podataka moguće je stvoriti informacije koje pomažu u lakšem razumijevanju komunikacijskih procesa. U takvom okruženju bitno je znati razlučiti tko stvara a tko konzumira informacije, kako bi se moglo pratiti njihov tijek, i proučavati uzročno-posljedične veze, odnosno potencijal širenja informacija. Ako problematici tako pristupimo, nismo više samo puki promatrači, već se stavljamo u poziciju da možemo upravljati takvim procesima i preokrenuti ih u vlastitu korist. Sličan primjer iz života možemo pronaći u arhitekturi, odnosno urbanom planiranju, gdje se dizajnom zgrada, ulica i općenito gradske infrastrukture, uvelike može utjecati na način kako ljudi komuniciraju.
Prijenos informacija i informacijsko ratovanje ne događaju se isključivo i jedino na društvenim mrežama. Ipak, dinamičnost i brzina promjena na takvim platformama čini ih idealnim za potencijalni predmet proučavanja.
Cambridge Analytica
Gotovo da i nije bilo domaćeg medija koji u posljednje vrijeme nije prenosio vijesti o engleskoj tvrtki Cambridge Analytica te “curenju” enormne količine privatnih podataka s Facebooka. Kako je danas politički oportuno prozivati američkog predsjednika, tako je većina internetskih portala i novina priču gradila oko “nezapamćene” manipulacije glasača od zločestog Trumpa te pomalo sažalijevala ikonu američke hipsterske scene, Marka Zuckerberga. Naravno, istina nikad nije crno-bijela, već pogađate – puna sivila.
Kako bismo aferu stavili u određeni kontekst, potrebno je navesti nekoliko činjenica. Cijela priča oko Cambridge Analytice nije nikakva novost, već se radi o dvije godine starom “štivu”, koje je spletom okolnosti za dnevno-političke teme tek sada izvađeno iz naftalina. Nadalje, korištenje Big Data infrastrukture, podatkovnih znanosti i napredne analitike, u smislu političkih kampanja, nije nikakva novina. Upravo je tim koji je stajao iza Obame osigurao prošlom američkom predsjedniku prevagu na izborima i učinio ga dvaput sigurnim pobjednikom.
U tom smislu javna dostupnost Facebookovih podataka upravo je u vrijeme Obamine administracije bila na kudikamo višim razinama, i ono što je danas dostupno kroz Facebook API (Application Programming Interface – točka za pristup pomoću koje je moguće obuhvatiti podatke), predstavlja tek manji dio onoga što je bilo dostupno prije.
Tako gledano, niti je Trump utjelovljenje vraga, niti Obama blaženika. Mark Zuckerberg tu, pak, igra posebnu igru i osoba je – čijoj se vrijednost tvrtke bazira prije svega na privatnim podacima koje smo joj svi mi svojevoljno predali – koja može biti sve samo ne nevino janje.
Geopolitička kretanja, informacijsko ratovanje i povod za istraživanje
Sada se pitate kakve veze imaju informacijsko ratovanje, Cambridge Analytica i Trump, posebice ako uzmemo u obzir medijske napise da se navedena tvrtka bavila psihološkim profiliranjem potencijalnih glasača. U tom smislu potrebno je sagledati širu sliku, koja se ne dodiruje samo Trumpa, već i općih geopolitičkih kretanja. Cambridge Analytica predstavlja tek jedan dio priče.
Gledajući kontekst američkih predsjedničkih izbora krajem 2016. godine, moguće je izdvojiti nekoliko pojmova koji se direktno naslanjaju na dezinformacijske aktivnosti (često dovođene u vezu s Rusijom). Tako je, primjerice, frazu fake news poznati engleski rječnik Collins proglasio najpopularnijom riječi 2017. godine. Pri tome pojam označava lažne, često senzacionalne vijesti, koje se šire pod okriljem regularnih medijskih novosti, a pojam je popularizirao upravo aktualni američki predsjednik Donald Trump. Popularizacija tzv. trollova i botova, nadalje, pridonijela je širenju dezinformacija tijekom navedenih predsjedničkih izbora, posebice preko društvenih mreža. Pod njima podrazumijevamo ljudski upravljane (troll) i automatizirane (bot) profile, koji svojim aktivnostima šire određenu agendu, najčešće, primjerice, širenjem lažnih vijesti ili zastupanjem određenih interesa.
U odnosu na SAD, potrebno je spomenuti trenutačne ekonomske i političke odnose na makro razini Europske unije, gdje je također aktualno pitanje ruskog utjecaja u sferi medijske manipulacije, posebice vezanog uz ekonomski rast te velesile koja ponovno vraća dio snage izgubljene nakon raspada Sovjetskog Saveza (a tu je i nedavno osvojeni novi mandat za Putina). Primjera radi, Europska služba za vanjsko djelovanje (EEAS) osnovala je Strategic Communications Division (StratCom) kako bi što učinkovitije parirala različitim dezinformacijama koje se plasiraju kroz medijski prostor članica EU.
Želimo li sve svesti u lokalne okvire, odličan primjer za to su i različiti društveni prosvjedi koji su se u recentnoj prošlosti odvijali na području Republike Hrvatske, a koji su organizirale različite nezavisne, neformalne i/ili neprofitne organizacije. Dva istaknutija događaja svakako su prosvjedi hrvatskih branitelja u Savskoj ulici u Zagrebu te prosvjedi za kurikularnu reformu na Trgu bana Josipa Jelačića, također u glavnom gradu Republike Hrvatske. Naravno, valja spomenuti i aktualna previranja vezana uz Istanbulsku konvenciju, ali i prosvjede protiv izgradnje LNG terminala na Krku.
Takvi i slični događaji nisu izolirani niti specifični za Hrvatsku te u svijetu više predstavljaju pravilo, nego iznimku. Budući da potencijalni efekti koje proizvode neupitno mogu dovesti do različitih promjena unutar teritorija jedne države (i šire), pravodobno uočavanje te proaktivno upravljanje tijekom informacija kojima se oni potiču svakako može pridonijeti većoj kontroli takvih procesa.
Na takvim pretpostavkama u dijelu analize temelji se i ovaj rad, konkretno u vidu prepoznavanja obrazaca plasiranja informacija na društvenim mrežama koje su se tijekom većine navedenih prosvjeda obilato koristile u smislu stvaranja određenog mnijenja javnosti o određenoj temi.
Alat za analizu – SNA
Prethodno je definiran prijenos informacija u onom najosnovnijem obliku: od ishodišta do cilja. Te dvije točke možemo nazvati akterima, entitetima ili čvorovima (engl. node), a njihovu međusobnu poveznicu vezom. Kako se u realnom svijetu susrećemo s velikim brojem entiteta i njihovih veza (koji čine mrežu), njihove međusobne odnose nije moguće lako razumjeti, pa u tom smislu trebamo koristiti analitičke metode koje će nam u tome pomoći. Takozvana analiza mreža nudi rješenje za tu vrstu problematike, a ovo istraživanje naslanja se na najvišu razinu takve analize, nazvanu Social Network Analysis (skraćeno SNA).
Radi se o strukturnoj analizi različitih vrsta veza koje nalazimo svuda oko nas, gdjegod postoji neki oblik socijalne interakcije. Ta se vrsta analize najčešće provodi pomoću programskih alata kako bi se izračunale različite varijable, odnosno metrike koje govore o tome kako unutar mreže jedan entitet utječe na drugi. Bez obzira na to što se SNA često koristi za analizu međuljudskih odnosa, valja napomenuti da ona omogućuje analiziranje različitih mrežnih struktura, bilo da se one javljaju u prirodi ili su umjetno stvorene. U ovom, konkretnom slučaju, Facebook profile i stranice valja definirati kao entitete.
Postoje različite razine SNA analize, i u tom smislu potrebno je razlikovati razinu individualnih aktera, gdje proučavamo utjecaj pojedinog entiteta, dijadnu razinu (dva entiteta), trijadnu razinu (tri entiteta), razinu podgrupe (pojedine komponente mreže, odnosno skupinu većeg broja entiteta) i globalnu razinu (mrežu u cjelini).
U nastavku će se razrada problematike provoditi najčešće na razini individualnih čvorova, ali i izračunima koji se odnose na dijelove ili kompletnu mrežu. Pri tome za analizu pojedinih entiteta koristimo takozvane mjere centraliteta (od kojih su neki opisani u priloženoj tablici), a analiza na razini podgrupa govori o tome jesu li dijelovi mreže povezani više ili manje, što će zorno biti prikazano na primjerima.
Tako govoreći, ranije je navedeno da upravljanje tijekom informacija predstavlja glavnih cilj ovog rada. Bez obzira na to jesmo li mi ti koji plasiramo informacije ili želimo spoznati procese koji kreiraju drugi, upravo utvrđivanjem različitih metrika možemo steći prednost u odnosu na druge. Time propagiranje naših poruka može postati učinkovitije, a oponentima to možemo otežati.
Čemu vizualizacija podataka?
Jedno od pitanja ovog istraživanja odnosi se upravo na svrhu prikazivanja podataka kroz vizualizaciju. Bilo bi posve pogrešno zaključiti da proces vizualizacije nepotrebno produljuje analitički proces, posebice ako u obzir uzmemo da velik broj različitih programskih i infrastrukturnih rješenja ima izrazito značajne mogućnosti u smislu obrade podataka. Međutim, upravo u tome i leži problem jer tradicionalni softveri često baziraju svoj output na pružanju informacija, a ne njihovom shvaćanju. Tako gledano, klasični tablični prikazi daleko su inferiorniji spram grafičkih, posebice u smislu prezentacije velikih količina podataka koji se danas generiraju svuda oko nas.
Osim tih prednosti, poznati stručnjak za vizualizaciju podataka Stephen Few navodi kako je vizualizacija ključna zbog činjenice jer olakšava spoznaju, odnosno osnažuje kogniciju. U tom smislu, ističe da interakcija i pregledavanje podatka kroz vizualizaciju povećava naše shvaćanje teme, jer mozak mnogo lakše percipira grafičke oblike nego pisane simbole poput slova i brojki te ujedno pomaže da počnemo sveobuhvatnije razmišljati o informacijama. Takve pretpostavke temelje se također i na činjenici da je ljudsko oko prirodno utrenirano da uočava uzorke, a slijedom toga, grafička prezentacija SNA analize svoje izvorište ima u matematičkoj teoriji grafova, točnije sociogramu koji grafički prikazuje strukturu veza između entiteta.
Zašto zapravo koristimo vizualizaciju prilikom provođenja SNA analize i je li takav postupak zaista potreban? Nakon izračuna metrika na razini pojedinačnih čvorova, kao i na razini cjelokupne mreže, grafički prikaz mreže, temeljen na takvim izračunima, uvelike nam može pomoći u potpunijem shvaćanju oblika i veličine mreže, kao i u uočavanju klastera te ključnih lokacija koje čine povezani entiteti. Budući da je pozicija i važnost noda u odnosu na druge nodove jedno od glavnih pitanja SNA analize, upravo je pomoću grafičkih prikaza lakše ukazati na takve relacije.
Vizualizacije nisu same sebi svrhom, već počivaju na ideji da nam omogućuju učinkovitiji i lakši proces zaključivanja kroz istraživanje i vizualno uspoređivanje kvantitativnih vrijednosti, odnosno pojedinačnih podataka. To u konačnici dovodi do značajnijeg pomaka u podlogama koje se koriste pri donošenju odluka, i finalni rezultati istraživanja počivat će upravo na tim premisama.
Eksplorativna analiza
Proces vizualizacije podataka (baš kao i postupak SNA analize) generalno se može (između ostalog) podijeliti na istraživačku (eksplorativnu) te usmjerenu analizu. Pri tome, usmjerenu karakterizira postavljanje hipoteza i posljedično potvrđivanje ili odbacivanje, odnosno cijeli postupak počinjemo pitanjem na koje želimo dati odgovor. Suprotno navedenom, istraživačku analizu karakterizira proučavanje podataka bez unaprijed postavljenog pitanja.
Ako u kontekstu ovog rada promatramo prirodu provođenja SNA analize i posljedične vizualizacije podataka, bitno je istaknuti da ne pretpostavljamo nikakve konkretne hipoteze te stoga možemo reći da će se ovdje raditi upravo o istraživačkoj analizi. Budući da su statistički modeli za izračun i testiranje hipoteza u sklopu SNA analize izrazito kompleksni i još uvijek nedovoljno razvijeni, fokus će primarno biti stavljen na spomenutu eksplorativnu analizu. Pojednostavljeno, prilikom SNA analize nećemo koristiti metode induktivne statistike, odnosno donošenja zaključaka o općoj populaciji na temelju uzoraka, zato što strukturna obilježja mrežnog uzorka rjeđe odražavaju strukturu kompletne mreže. Taj rad stoga je baziran na istraživanju i utvrđivanju karakterističnih obilježja mreže, koja nam mogu donijeti novo znanje u smislu donošenja potencijalno važnih zaključaka koje možemo primijeniti za djelovanje u informacijskom prostoru. Bitno je poštovati redoslijedna pravila koja se vežu uz takav proces, zato što za ostvarivanje rezultata moramo stvoriti i određene preduvjete koji proizlaze iz prethodnih koraka takvog procesa. To podrazumijeva da postupak biva točno određen.
U tom smislu proces istraživačke analize temeljene na SNA tehnikama sastoji se od četiri dijela: 1. definicije mreže, 2. manipulacije mreže, 3. izračunu metrika (definiranju strukturnih obilježja) i 4. vizualizaciji.
Modeliranje mreže za analizu
U uvodnom dijelu rečeno je da upravo društvene mreže zbog svoje opće prihvaćenosti i dinamičnosti predstavljaju savršeni poligon za komuniciranje, pa tako i obavljanje različitih analiza tih komunikacija. S tim u vezi, predstavljaju i idealni teren za širenje interesne propagande. U usporedbi s Twitterom, koji na području Republike Hrvatske koristi manje od 100 tisuća ljudi, Facebook broji daleko najviše korisnika (najmanje 1,5 milijuna) pa se može smatrati najrelevantnijim za potencijalno istraživanje.
Jedno od temeljnih pitanja prenošenja poruka svakako jest i ono kako širiti informacije, točnije kome prenijeti poruku/oglas da takav proces bude najučinkovitiji. Psihološko profiliranje (opet poveznica s Cambridge Analyticom i izdanjem Mreže iz ožujka 2017.) u tom kontekstu govori o određenim bihevioralnim karakteristikama pojedine osobe i kakav im je tip poruke potrebno plasirati, a SNA nadograđuje cijelu priču na višu razinu i daje odgovor na pitanje kome takve poruke plasirati kako bi disperzija informacija bila najučinkovitija. Primjera radi, nije isto ako jedna osoba koju ciljate ima 100 prijatelja, ili druga koja ima 10, ali su među njima predsjednica i premijer. Socijalna fizika, pak, radi nadogradnju na SNA, a što je također bilo obrađeno u ovom časopisu, dvobroj od kolovoza i rujna 2016. godine.
Odgovor na sve navedeno, naravno, nikad nije posve simplificiran i korišteni algoritmi nikad nisu nužno 100% točni, no ovakve tehnike uvelike pomažu u povećanju uspješnosti provođenja različitih kampanja do neslućenih razina. Jedno takvo istraživanje je i ovo, provedeno nad oko 150 domaćih Facebook stranica.
Zašto stranica? Primarno je potrebno razlikovati tri osnovne vrste Facebook entiteta, a to su redom osobni profili korisnika, stranice i grupe. U pogledu privatnosti, različita ograničenja koja nameće ranije spomenuti Facebookov API, punog naziva The Graph API, bivaju odlučujućima u smislu odabira koje podatke možemo prikupiti, odnosno analizirati, a koje ne.
Primarni fokus
Ovdje je potrebno ponovno se referencirati na Cambridge Analyticu. U pogledu ovog rada primarni fokus određuje navedena javna dostupnost podataka. Kako je kontekst u kojem djeluju Facebook stranice primarno javnog karaktera, razina dostupnosti podataka o njima kudikamo je veća u odnosu na informacije koje se mogu obuhvatiti za osobne profile. Tako rečeno, moguće je obuhvatiti i podatke o tome koje stranice slijedi neka stranica, što će ujedno činiti bazu ovog modela. Cijela priča oko koje se vrti afera s Cambridge Analyticom pretpostavlja, pak, “neovlašteno” korištene privatnih podataka osobnih profila (koje su korisnici svojevoljno predali korištenjem određenih kvizaških aplikacija). Među tim podacima bile su izrazito bitne liste prijatelja kompromitirajućih profila koji su koristili aplikaciju, jer su pružale informacije o prijateljskim vezama svake pojedine osobe koja je koristila aplikaciju (tzv. egocentrična jednostupanjska mreža).
Pojednostavljeno, na temelju prikupljenih podataka o prijateljstvima pojedinog profila, dobiven je niz takvih egocentričnih mreža koje je kasnije moguće “spojiti” u jednu veliku mrežu. Nad takvom mrežom tada se obavljaju matematički izračuni i dobivaju informacije o važnosti pojedinih profila. Zbog toga je bilo dovoljno da, kako mediji navode, kvizašku aplikaciju položi nekih 300 tisuća ljudi, a na kraju dobijemo mrežu koju čini preko 80 milijuna spominjanih profila (prijatelji prijatelja – dvostupanjska mreža, prijatelji prijateljevih prijatelja – trostupanjska mreža, itd.). Također, ranije spomenute predsjedničke kampanje koje su dovele Obamu na vlast koristile su, između ostalog, i neke slične tehnike analize, pri čemu se upravo Obamu glorificiralo kako je genijalno iskoristio društvene mreže u svoju korist. Danas, pak, gledamo skoro identičnu situaciju s posve drugačijim efektom za aktualnog predsjednika i ljude koji su radili za njega. S druge strane, postavlja se pitanje bi li do ovakve afere uopće došlo da je Trump izgubio, a Clinton pobijedila.
Kako autor ovog istraživanja nema resurse poput Cambridge Analytice, niti budžet da podatke kupi direktno od Facebooka ili podatkovnih brokera, analiza je obavljana upravo na temelju javno dostupnih podataka o Facebook stranicama, odnosno vezama koje egzistiraju između takvih stranica. Osnovni model pretpostavljat će upravo takvu mrežu koja je zatvorena te nema doticaja ni s kakvim drugim tipom Facebook entiteta. Takav model predstavlja do određene mjere ograničavajući faktor, jer se kolanje informacija na Facebooku ne događa isključivo između stranica. Za najtočniji izračun bilo bi potrebno izgraditi mrežu koju čine sve vrste osnovnih Facebook entiteta, međutim, i analiza bazirana na jednomodalnoj mreži sačinjenoj od stranica može biti dovoljno indikativna za izvlačenje određenih zaključaka i uočavanje trendova.
Kontekstualizacija osnovnog modela
Prije samog povlačenja podataka i posljedične obrade, bilo je potrebno razraditi koncept prema kojem će stranice biti grupirane (strukturirane), u skladu s ranije izrečenim pretpostavkama koje se dotiču funkcioniranja Facebook stranica. U tom pogledu, glavno načelo prema kojem se vodio takav postupak jest homofilija, odnosno povezivanje između čvorova (stranica) na temelju njihove sličnosti, što u konačnici direktno utječe i na strukturu same mreže. Zbog toga je bilo izrazito bitno grupirati stranice sličnih obilježja, pri čemu valja naglasiti da je korišteno načelo homofilije iz aspekta nominalnih karakteristika, ne numeričkih. Pojedina literatura u tom se aspektu naslanja i na tzv. topic centric mreže, odnosno one mreže čije se veze između čvorova temelje na određenim temama (primjerice, povezivanje Twitter profila na temelju korištenja identičnih hashtag oznaka u objavama).
Kako bi se osigurala maksimalna nepristranost i balans, entiteti koji će u nastavku predstavljati predmet proučavanja bili su podijeljeni u tri grupe, od kojih su dvije prema značaju najbitnije – jedna koja je u društvenom i političkom kontekstu bliža ljevici (oznaka L) te druga koja je bliža desnici (oznaka D). Treću grupu čine takozvane nesvrstane stranice (oznaka N). Takva podjela upravo se naslanja na nedavne značajnije prosvjede u Republici Hrvatskoj, koji su spomenuti u prethodnim odlomcima te ujedno predstavljaju jedan od povoda za izradu ove analize. Kako su navedeni događaji bili politički suprotnog pola, tako će se formirati i ova analiza. Podskupine te tri generalne grupe čine različite interesne organizacije – udruge, mediji, istaknute javne osobe, političke stranke i tome slično. U tom kontekstu važno je napomenuti da su iz analize namjerno izostavljeni veliki mainstream mediji kojima upravlja privatni kapital, i velike političke stranke, te kako se naglasak stavio upravo na niz manjih sudionika koji se najčešće proklamiraju kao nezavisni i neprofitni te nisu nužno istureni u javnosti, ali imaju značajan utjecaj. Razlog tome leži upravo u činjenici da njihovo djelovanje najčešće ne može biti čak niti djelomično prikriveno u smislu opsega i ciljeva kao što je to, primjerice, slučaj s velikim medijima. Sama činjenica da njihova egzistencija ovisi o donacijama države ili privatnog sektora, čini ih dovoljno podložnima utjecajima vanjskih čimbenika pa se pod tom pretpostavkom njihovo proklamirano “nezavisno” djelovanje može smatrati u najmanju ruku upitnim. Njihova međusobna povezanost tada je posljedično zanimljiv predmet analize kako bismo shvatili potencijal širenja informacija.
Ukupno su povučeni podaci za 146 ishodišne Facebook stranice te posljedično isto tako i njihove odlazne veze. U tom smislu, radi se o 146 egocentrične mreže, koje su podijeljene u tri osnovne grupe, a zatim grupirane u 15 podgrupa. Stranice su pri tome morale zadovoljiti nekoliko kriterija, primjerice, recentnu aktivnost, postojanje odlaznih veza prema drugim stranicama, korištenje hrvatskog jezika, itd. Jednom kad su podaci strukturirani, definiran je svojevrstan informacijski (medijski) prostor koji ujedno čini i glavno područje istraživanja.
Glavno korišteno oruđe
U praktičnom smislu, proces analize sastojao se od povlačenja podataka, njihove pripreme (na što u pravilu odlazi najviše vremena) te suštinske analize i vizualizacije. Primarno su korištena dva poznata alata za analizu – NodeXL (povlačenje i priprema) te Gephi za analizu i vizualizaciju mreža. U tom se smislu radilo o statičnim, a ne dinamičnim podacima, pri čemu bi u slučaju potonjih trebalo koristiti neke naprednije alate kao što je GraphX (a tu su i NetworkX, odnosno kultni slovenski Pajek).
Tipovi korištenih datoteka kretali su se od standardnog .xlsx formata pa do kombiniranja egocentričnih mreža za pojedinu Facebook stranicu (odnosno već spomenutih odlaznih veza pojedine stranice), izraženih u formatu .graphml. Grupiranje je rezultiralo formatom .gefx datoteka, nad čime je obavljena i glavnina analitičkih operacija. Posljednja dva spomenuta formata baziraju se na popularnom standardu .xml pa tako omogućuju i spremanje niza drugih atributa (primjerice, broj fanova pojedine stranice).
Tehnička gledišta analize
Ranije spomenuta važnost pojedinih nodova na temelju izračunatih metrika, reflektira se upravo kroz njihovu moć propagiranja informacija u pretpostavljenom modelu. Na to se direktno naslanja teorija o takozvanim nerazmjernim mrežama, koje karakterizira distribucija zakona potencije, tj. postojanje većeg broja čvorova s malo veza, odnosno manjeg broja s mnogo veza. Takve mreže svojstvene su za sustave koje je stvorio čovjek, baš poput Interneta i društvenih mreža. U kontekstu ovog istraživanja posebice je zanimljiva činjenica da su opisane mreže izrazito osjetljive na napade prema važnim čvorovima te njihovim brisanjem distribucija informacija postaje teža. U prijevodu, ovdje do značaja dolazi ono što je već nekoliko puta istaknuto – znanje o bitnim entitetima (stranicama) može nam povećati učinkovitost plasiranja informacija od našeg interesa, odnosno omogućiti neutraliziranje protivnika ili, u najmanju ruku, otežati njegovo djelovanje (prisjetimo se samo virtualnog rata između domaće desnice i ljevice nakon samoubojstva general-pukovnika Slobodana Praljka i rušenja niza domaćih Facebook stranica).
Također, valja istaknuti da u vizualizacijskom smislu veličinu pojedinog entiteta predstavlja vrijednost izračunate metrike centraliteta za taj isti entitet [veći krug (entitet) = veća vrijednost]. Drugo, u procesu se koristio koncept izrade mreža, prema kojem se boje koriste za označavanje entiteta i njihovih odlaznih veza, kako bi se naglasila njihova pripadnost određenoj grupi. To često podrazumijeva označavanje različitih komponenti (klastera) mreže različitim bojama, međutim, u ovom konkretnom slučaju boje su korištene kako bi se naglasila pripadnost entiteta i njihovih veza pojedinim podgrupama stranica. Treće, nazivi stranica uobičajeno se ispisuju preko krugova koji prikazuju pojedine čvorove, no u ovom slučaju nazivi su namjerno uklonjeni.
Neizostavni dio vizualizacija mreže predstavljaju tzv. energy layouts, koji su bazirani na različitim matematičkim algoritmima te pomažu u završnom stadiju vizualizacije. To rade tako da mrežu vizualno poslože tako da se čvorovi koji su međusobno više povezani privlače, a oni manje povezani se udaljuju. Za potrebe priloženih vizualizacija korišteni su algoritmi ForceAtlas2 i Yifan Hu.
Tablica: Opis mjera centraliteta na razini pojedinačnih entiteta
Mjera centraliteta | Opis |
Degree | Broj dolaznih i odlaznih veza nekog čvora |
Closeness | Udaljenost jednog čvora do drugog. Mjera je veća što u manjem broju koraka možemo dosegnuti neki drugi čvor, što ujedno znači i brže širenje informacija |
Betweenness | Uloga pojedinog čvora kao posrednika između drugih entiteta, točnije kontrola koju čvor ima nad interakcijom drugih |
Eigenvector | Mjera pokazuje važnost pojedinog čvora tako da on ne mora imati nužno veliki broj veza kako bi bio važan, već i manji broj ako je povezan s čvorovima koji imaju velik broj veza pa samim time preuzima dio njihovog utjecaja |
PageRank | Varijanta Eigenvectora, koji u obzir između ostalog uzima i težinu veza između čvorova (različite veze imaju različiti stupanj važnosti, odnosno pondere). Tvorci mjere su Larry Page i Sergey Brin |
Rezultati?
Šlag uvijek dolazi na kraju. Iako su rezultati ovog istraživanja kudikamo sveobuhvatniji, format časopisa ipak zahtjeva sažimanje najznačajnijih zaključaka. Tako su kroz priložene vizualizacije prikazane informacije o detaljima mreže na razini pojedinih entiteta te isto tako i na razini podgrupe.
Vizualizacije s brojčanom oznakom 1 i 2 u tom se smislu oslanjaju na analiziranu mrežu koju čine stranice iz grupe D. Slika broj 1 prikazuje važnost pojedinih stranica sukladno veličini krugova, i to za mjeru centraliteta Betweenness. Pri tome, najveći krug narančaste boje, koji se nalazi na sredini slike, prikazuje nezavisni portal desnog političkog usmjerenja, koji ima najznačajniju ulogu u kontroli protoka informacija između pojedinih dijelova mreže. Iza navedenog portala stoji poznata neprofitna udruga, a njegova uloga u tom smislu dočarava značajnu kontrolu informacija između ostalih dijelova mreže. Na lijevoj strani vizualizacije dominiraju stranice nezavisne propagande (roza boja), a na desnoj proreligijske stranice (cijan boja).
Vizualizacija oznake broj 2 odnosi se na PageRank, koji ukazuje na stranice koje preuzimaju dio utjecaja od drugih stranica. Ta mjera centraliteta svoju svrhu demonstrira između ostalog i tako da pomaže identificirati čvorove za koje nismo nužno mislili da su bitni. Pri tome je na slici vidljivo nekoliko većih krugova, označenih sivom bojom koja je služila za bojanje onih stranica čije egocentrične mreže uopće nisu povlačene. To znači da neke “prikrivene” stranice, koje nisu bile predmetom inicijalne analize, definitivno moramo preispitati u smislu njihove mogućnosti propagacije informacija.
Slika broj 3 odnosi se na analizu kombinaciju stranica iz grupe L i N, točnije na mjeru Closeness, i govori o tome kako pojedini nodovi mogu dosegnuti ostatak mreže u najmanjem broju koraka. Takve stranice su stoga pogodne za brzo širenje informacija, pri čemu se, primjerice, ističu stranice iz podskupine nezavisne propagande (svijetlozelena boja), antireligijske organizacije (smeđa boja) i stranice javno eksponiranih individua (maslinastozelena boja). Zanimljivo je da i Platforma 112 (crvena boja) ima značajan broj stranica s relativno izraženom vrijednosti ove metrike.
Slike broj 4 (grupa D) i 5 (grupe L i N) odnose se na analizu najvećih komponenti, odnosno pojedinih jače povezanih dijelova mreže. U pogledu stranica grupe D pokazano je da od analiziranih entiteta primarno proreligijske interesne organizacije (cijan boja) i mediji (narančasta boja) sa svojim odlaznim vezama ulaze u najveću komponentu koja nosi preko 20% mreže. Njihova nepobitna umreženost u tom smislu daje posve novi kontekst procesima u sklopu kojih se distribuiraju vijesti u informacijskom prostoru.
Gledajući kombinaciju stranica grupe L i N nije analizirana samo najveća komponenta, već tri najveće, zbog sličnog udjela u ukupnoj mreži (ukupno nešto manje od 40%). Kako bi se dobio još jasniji uvid u vrstu analiziranih stranica koje dominiraju pojedinim komponentama, na slici 5 pokazane su tri najveće komponente zasebno te sve tri zajedno. Lako je uočiti da prvom najvećom dominira zelena boja (nezavisna propaganda), drugom najvećom crvena (Platforma 112), a trećom najvećom svijetloljubičasta (mediji). Takva međusobna veća direktna ili indirektna povezanost i u ovom slučaju daje značajan kontekst propagaciji informacija.
Uspoređujući izrečene činjenice između kombinacije stranica grupe D te grupe L i N, lako je doći do zaključka da zajednička karakteristika koja se javlja u oba slučaja jest upravo veća izražena direktna i indirektna povezanost medija i različitih interesnih organizacija. S obzirom na to da većina analiziranih entiteta takvog tipa naglašava svoju nezavisnost u djelovanju, vjerodostojnost takvih tvrdnji postaje suspektna.
Vrli novi (stari) svijet
Na ovim stranicama pokušalo se na što trivijalniji način prikazati samo jedan manji dio analitičkih tehnika koje se koriste u modernim političkim kampanjama (a i puno šire). Iako se u tom smislu velik dio sadržaja bazirao na istraživanju propagacije informacija korištenjem SNA tehnika, one predstavljaju samo manji dio sveukupnog landscapea koji se u takvim situacijama koristi. Uspostavljanje temeljne Big Data infrastrukture, napredni media monitoring, NLP (Natural Language Processing) i razni oblici strojnog učenja (da ne nabrajam dalje) samo su dio mozaika koji čine suvremeni sustavi za upravljanje kampanjama. Budite sigurni da ono o čemu danas pišu mainstream mediji, maheri iz sjene rade već odavno, a ono što se događa u ovom trenutku, saznat ćete tek nakon nekog vremena – i to možda. Pitanja o privatnosti u tom je kontekstu uopće suludo postavljati.
Istraživanje je provedeno u razdoblju jesen/zima 2017.-2018. Srečko Zajec svestrani je analitičar s dva završena diplomska i jednim poslijediplomskim studijem. Rad su podržali AlgebraLAB i direktor doc. dr. sc. Leo Mršić.
NAPOMENA: Ovaj tekst je izvorno objavljen u časopisu Mreža.