OpenAI predstavio nove modele serije o3

Model može razmišljati kroz zadatak i planirati unaprijed, izvodeći niz radnji tijekom duljeg razdoblja koje mu pomažu pronaći rješenje.

Miroslav Wranka petak, 27. prosinca 2024. u 11:45
📷 Jonathan Kemper (Unsplash)
Jonathan Kemper (Unsplash)

OpenAI je predstavio model o3, nasljednika serije o1 objavljene ranije ove godine. Novu seriju čine o3 i o3-mini, manji model namijenjen posebnim zadacima.  

Što se dogodilo s o2? Čini se kako su u OpenAI-ju htjeli izbjeći moguću zbrku zbog sličnosti s  britanskim pružateljem telekomunikacijskih usluga O2. 

Oba nova modela još nisu široko dostupna, ali istraživači koji se bave računalnom sigurnosti mogu se prijaviti za korištenje već sad. Prema najavama, za širu javnost o3-mini bi trebao stići krajem siječnja, nakon čega bi trebao slijediti o3. 

OpenAI kaže kako koriste novu tehniku "promišljenog usklađivanja" kako bi izbjegli mogućnost pokušaja zavaravanja ljudskih korisnika. Za razliku od većine drugih modela, modeli rasuđivanja kao što je o3 sami sebe provjeravaju, što im pomaže u izbjegavanju nekih od problema s kojima se modeli umjetne inteligencije inače susreću.

Ovaj postupak provjere činjenica uzrokuje određeno kašnjenje. o3, kao i o1 prije njega, treba malo dulje - u rasponu od nekoliko sekundi do minute duže - kako bi došao do rješenja. Obično je pouzdaniji u područjima kao što su fizika, znanost i matematika.

o3 je obučen putem učenja uz potvrđivanje kako bi "razmislio" prije nego što odgovori putem onoga što OpenAI opisuje kao "privatni lanac misli". Model može razmišljati kroz zadatak i planirati unaprijed, izvodeći niz radnji tijekom duljeg razdoblja koje mu pomažu pronaći rješenje.

U praksi, nakon upita, o3 zastaje prije nego što odgovori, razmatra niz povezanih upita i usput "objašnjava" svoje rasuđivanje. Nakon nekog vremena, model sažima ono što smatra najtočnijim odgovorom.

Gledajući jedno mjerilo, OpenAI se polako približava općoj umjetnoj inteligenciji. Na ARC-AGI, testu osmišljenom za procjenu može li sustav učinkovito steći nove vještine izvan seta podataka na kojem je obučavan, o3 je u najzahtjevnijim okolnostima postigao trostruko bolju izvedbu nego o1.

No, s druge strane je podbacio na vrlo lakim zadacima, a i pokazuje temeljne razlike u odnosu na ljudsku inteligenciju. 

Na drugim testovima, o3 je nadmašio konkurenciju. Naravno, treba pričekati rezultate procjena izvan samog OpenAI-ja.