Novi test za umjetnu inteligenciju pretežak za sadašnje modele

Test uključuje tisuće pitanja skupljenih crowdsouringom koja se dotiču predmeta poput matematike, humanističkih i prirodnih znanosti.

Miroslav Wranka četvrtak, 30. siječnja 2025. u 11:45

Pavel Danilyuk (Pexels)

Neprofitna organizacija Center for AI Safety (CAIS) i Scale AI, tvrtka koja pruža usluge označavanja podataka i razvoja umjetne inteligencije, objavili su nove testove naprednih sustava umjetne inteligencije.

Nazvan Humanity's Last Exam (Posljednji ispit čovječanstva), test uključuje tisuće pitanja skupljenih crowdsouringom koja se dotiču predmeta poput matematike, humanističkih i prirodnih znanosti. Kako bi bio što zahtjevniji, pitanja su u više formata, uključujući dijagrame i slike.

U preliminarnoj studiji niti jedan javno dostupan vodeći sustav nije uspio postići rezultat bolji od 10 posto. CAIS i Scale AI namjeravaju Humanity's Last Exam otvoriti istraživačkoj zajednici kako bi omogućili dublje istraživanje varijacija i procjenu novih modela umjetne inteligencije.

Novi test za umjetnu inteligenciju pretežak za sadašnje modele

Vezano

Vrhunski hi-fi zvuk uz najbolje popuste!

KEF Q7 Meta

DALI KUPID Black Ash

PRO-JECT E1.2, , PICK IT, MM

KEF Coda W Dark Titanium

Bluesound PowerNode N331

WiiM Ultra

Ronis Velesajam

Trenutno najpovoljnije cijene na tržištu

Vezano

rigoroz

Novi test za procjenu naprednih AI sustava: "Posljednji ispit čovječanstva"

Oxfordshire

Tortura satelita: Novi britanski centar simulira ekstremne uvjete svemira

Umjetna inteligencija

Arc - asistent pogonjen umjetnom inteligencijom za izvođenje raznovrsnih radnji

KAO UKRAJINA

Starlink nudi besplatan internet u Venezueli, iako službeno ne posluje tamo

UMJETNA INTELIGENCIJA

Online tržišta koja dobivaju promet s umjetnom inteligencijom

Automatizacija pisanja izvješća

AI softver u službenom izvješću napisao da se policajac – pretvorio u žabu