Koji LLM modeli imaju IQ iznad prosjeka ljudi?

Web stranica Tracking AI (https://trackingai.org/home), inače analizira i uspoređuje modele umjetne inteligencije na različite načine

Mreža subota, 7. lipnja 2025. u 10:18

Rangirala je 24 vodeća modela umjetne inteligencije prema njihovim rezultatima na Mensa Norway Intelligence QQ testu, kognitivnom mjerilu visoke težine koje se koristi za procjenu IQ-a. Za kontekst, prosječni ljudski IQ kreće se od 90 do 110, dok se rezultat iznad 130 obično smatra genijalnošću.

📷 https://trackingai.org/home
https://trackingai.org/home

Ključni zaključci testiranja su da OpenAI-jev o3 model vodi među svim natjecateljima s IQ-om od 135, što ga svrstava u genijalni raspon, Anthropicov Claude-4 Sonnet (127) i Googleov Gemini 2.0 Flash (126) također značajno nadmašuju prosječnu ljudsku inteligenciju, zajedno s Geminijem 2.5, OpenAI o4 mini i Claude-4 Opusom.

Prvih 10 po rezultatima testiranja su modeli koji sadrže samo tekst, dok su multimodalni i vizualni modeli niže rangirani u smislu IQ-a.

Modeli s vizualnim tehnologijama, kao što su GPT-4o (Vision) i Grok-3 Think (Vision), postigli su samo 63 odnosno 60 bodova - najniže od svih testiranih.