Najpametniji AI modeli 2026.
Prema podacima iz travnja ove godine tvrtke TrackingAI, koja uspoređuje modele na Mensa Norway IQ testu, Grok-4.20 Expert Mode i OpenAI GPT-5.4 Pro (Vision) dijele prvo mjesto s rezultatom 145 bodova
Slijede ih Gemini 3.1 Pro Preview prati odmah iza, s rezultatom 141 bod.
Male razlike u rezultatima vodećih modela ukazuju na to da se modeli umjetne inteligencije na vrhu sve više konvergiraju, gdje razlika od samo nekoliko bodova može promijeniti poredak.
Istodobno su vidljiva značajna unapređenja u odnosu na 2025. godinu. Prošlogodišnji najbolji rezultat iznosio je 135 bodova, u usporedbi s 145 bodova u ovogodišnjim rezultatima, što naglašava brzinu kojom vodeći modeli poboljšavaju svoje performanse na ovakvim testovima.
Nisu svi modeli ostvarili napredak. Među glavnim predvodnicima umjetne inteligencije, najbolji Mistralov model zauzima najniže mjesto, s rezultatom 97 — znatno ispod vodeće skupine.

Kako TrackingAI provodi test
TrackingAI koristi javni test Mense Norway, koji se sastoji od 35 zagonetki s vizualnim uzorcima. Za modele koji ne koriste vid, pitanja se verbaliziraju, dok modeli s vizualnim sposobnostima izravno primaju izvorne slike.
Zbog toga rezultate treba promatrati kao referentnu usporedbu, a ne kao konačnu mjeru ukupne inteligencije. Budući da je test u osnovi vizualan, rezultati modela mogu varirati ovisno o načinu na koji su pitanja predstavljena.
TrackingAI-jeva ljestvica najboljih rezultata korisna je jer nudi jednostavan i poznat način usporedbe performansi zaključivanja tijekom vremena. Stranica također napominje da se, ako model odbije odgovoriti, isto pitanje može postaviti do deset puta, pri čemu se za bodovanje uzima najnoviji odgovor.
Ipak, benchmark u stilu IQ-a obuhvaća samo jedan dio sposobnosti. Ne mjeri sve što je važno u stvarnoj primjeni umjetne inteligencije, poput sposobnosti programiranja, pouzdanosti informacija, korištenja alata ili performansi u profesionalnim područjima.