Koji LLM modeli imaju IQ iznad prosjeka ljudi?
Web stranica Tracking AI (https://trackingai.org/home), inače analizira i uspoređuje modele umjetne inteligencije na različite načine

Rangirala je 24 vodeća modela umjetne inteligencije prema njihovim rezultatima na Mensa Norway Intelligence QQ testu, kognitivnom mjerilu visoke težine koje se koristi za procjenu IQ-a. Za kontekst, prosječni ljudski IQ kreće se od 90 do 110, dok se rezultat iznad 130 obično smatra genijalnošću.
Ključni zaključci testiranja su da OpenAI-jev o3 model vodi među svim natjecateljima s IQ-om od 135, što ga svrstava u genijalni raspon, Anthropicov Claude-4 Sonnet (127) i Googleov Gemini 2.0 Flash (126) također značajno nadmašuju prosječnu ljudsku inteligenciju, zajedno s Geminijem 2.5, OpenAI o4 mini i Claude-4 Opusom.
Prvih 10 po rezultatima testiranja su modeli koji sadrže samo tekst, dok su multimodalni i vizualni modeli niže rangirani u smislu IQ-a.
Modeli s vizualnim tehnologijama, kao što su GPT-4o (Vision) i Grok-3 Think (Vision), postigli su samo 63 odnosno 60 bodova - najniže od svih testiranih.