Microsoft ima novu mini umjetnu inteligenciju

Nadahnuće za obuku ovog modela preuzeto je od načina kako su djeca učila iz priča za laku noć, knjiga s jednostavnijim riječima i strukturama rečenica koje govore o širim temama.

Mreža četvrtak, 25. travnja 2024. u 06:08
📷 Markus Spiske (Pexels)
Markus Spiske (Pexels)

Microsoft je predstavio novu inačicu malog modela umjetne inteligencije Phi-3 Mini, prvog od tri takva koje planira objaviti.

Phi-3 Mini mjeri 3,8 milijardi parametara i trenira se na skupu podataka koji je manji u odnosu na velike jezične modele poput GPT-4. Sada je dostupan na Azureu, Hugging Faceu i Ollami. 

Microsoft planira izdati Phi-3 Small (sedam, milijardi parametara) i Phi-3 Medium (14 milijardi parametara). Parametri su mjera koliko složenih uputa model može razumjeti.

U prosincu su objavili Phi-2, koji je radio jednako dobro kao i veći modeli poput Llame 2. Phi-3 bi trebao imati bolje performanse i ponuditi odgovore slične modelu 10 puta većem od njega.

Nadahnuće za obuku ovog modela preuzeto je od načina kako su djeca učila iz priča za laku noć, knjiga s jednostavnijim riječima i strukturama rečenica koje govore o širim temama.

Mali modeli umjetne inteligencije često su jeftiniji i bolje rade na osobnim uređajima poput telefona i prijenosnih računala. 

Uz Phi, tvrtka je izgradila i Orca-Math, model usmjeren na rješavanje matematičkih problema.

Microsoftovi konkurenti također imaju svoje male modele umjetne inteligencije, od kojih većina cilja na jednostavnije zadatke poput sažimanja dokumenata ili pomoći kodiranja. 

Google Gemma 2B i 7B dobri su za jednostavne chatbotove i rad vezan uz jezik. 

Anthropicov Claude 3 Haiku može čitati guste istraživačke radove s grafikonima i brzo ih sažeti, dok se nedavno objavljeni Llama 3 8B iz Mete može koristiti za neke chatbotove i za pomoć kodiranja.