Novi test za umjetnu inteligenciju pretežak za sadašnje modele

Test uključuje tisuće pitanja skupljenih crowdsouringom koja se dotiču predmeta poput matematike, humanističkih i prirodnih znanosti.

Miroslav Wranka četvrtak, 30. siječnja 2025. u 11:45
📷 Pavel Danilyuk (Pexels)
Pavel Danilyuk (Pexels)

Neprofitna organizacija Center for AI Safety (CAIS) i Scale AI, tvrtka koja pruža usluge označavanja podataka i razvoja umjetne inteligencije, objavili su nove testove naprednih sustava umjetne inteligencije.

Nazvan Humanity's Last Exam (Posljednji ispit čovječanstva), test uključuje tisuće pitanja skupljenih crowdsouringom koja se dotiču predmeta poput matematike, humanističkih i prirodnih znanosti. Kako bi bio što zahtjevniji, pitanja su u više formata, uključujući dijagrame i slike.

U preliminarnoj studiji niti jedan javno dostupan vodeći sustav nije uspio postići rezultat bolji od 10 posto. CAIS i Scale AI namjeravaju Humanity's Last Exam otvoriti istraživačkoj zajednici kako bi omogućili dublje istraživanje varijacija i procjenu novih modela umjetne inteligencije.