Meta Platforms ima novi vlastiti čip za umjetnu inteligenciju

Interno nazvan "Artemis", novi bi čip trebao pomoći u smanjenju Metinog oslanjanja na Nvidiju, kao i smanjenje troškova energije općenito.

Miroslav Wranka ponedjeljak, 15. travnja 2024. u 06:10
📷 Laura Ockel (Unsplash)
Laura Ockel (Unsplash)

Tvrtka Meta Platforms otkrila je pojedinosti o sljedećoj generaciji vlastitog čipa za akceleraciju umjetne inteligencije.

Reuters je ranije ove godine izvijestio kako Meta planira implementirati novu verziju prilagođenog čipa za podatkovni centar kako bi se pozabavila rastućom količinom računalne snage potrebne za pokretanje proizvoda s umjetnom inteligencijom na Facebooku, Instagramu i WhatsAppu. 

Čip, interno nazvan "Artemis", trebao bi pomoći u smanjenju Metinog oslanjanja na Nvidiju, kao i smanjenje troškova energije općenito.

"Arhitektura ovog čipa temeljno je usmjerena na pružanje odgovarajuće ravnoteže računanja, propusnosti memorije i kapaciteta memorije za posluživanje modela rangiranja i preporuka", navedeno je u objavi na službenom blogu.

Novi čip Meta Training and Inference Accelerator (MTIA) dio je širokeg razvojnog procesa, u sklopu kojeg se razmatra i mogućnost izrade drugih hardverskih komponenti. 

Osim izrade čipova i hardvera, Meta je značajno ulagala u razvoj softvera potrebnog za iskorištavanje infrastrukture na najučinkovitiji način.

Tvrtka također troši milijarde na kupnju Nvidijinih i drugih AI čipova.

Ove je godine glavni izvršni direktor Mark Zuckerberg rekao kako Meta planira nabaviti otprilike 350 tisuća čipova H100 od Nvidije. U kombinaciji s drugim dobavljačima, taj bi broj trebao dosegnuti 600 tisuća čipova H100 ili njima ekvivalentnih.

Taiwan Semiconductor Manufacturing Co proizvodit će novi čip koristeći petnanometarsku tehnologiju. Trebao bi imati tri puta bolje performanse nego prva generacija Metinih procesora.

Čip je postavljen u podatkovnom centru i služi aplikacijama umjetne inteligencije. 

U tijeku je nekoliko programa čiji je cilj proširenja opsega MTIA-e, uključujući podršku radnih opterećenja generativne umjetne inteligencije.