Amazon Titan - novi model za generiranje slika pomoću umjetne inteligencije

Titan nije samostalna aplikacija nego alat na kojem programeri mogu izraditi vlastite generatore slika koje pokreće model temeljen na Amazon Bedrocku

Tomislav Stanković četvrtak, 30. studenog 2023. u 11:10
📷 Image: Unsplash
Image: Unsplash

Amazon Titan je multimodal koji se temelji na dva osnovna modela Amazon Titan Image Generator i Amazon Titan Multimodal Embeddings, objavljeno je tijekom konferencije AWS re:Invent.

"Modeli Amazon Titan uključuju 25 godina inovacija umjetne inteligencije (AI) i strojnog učenja (ML) u Amazonu i nude niz opcija visokoučinkovitih slikovnih, multimodalnih i tekstualnih modela putem potpuno upravljanog API-ja." - izjavila je Antje Barth, glavni zagovornik programera za generativni AI u AWS-u.

Titan Image Generator

Titan Image Generator može kreirati "realistične slike studijske kvalitete" uz ugrađene zaštitne mehanizme protiv toksičnosti i pristranosti. Usmjeren je na poslovnu publiku, a ne na postojeće potrošačke generatore slika kao što je OpenAI DALL-E.

Slike kreirane ovim modelom sadržavat će nevidljivi vodeni žig, "osmišljen kako bi se smanjilo širenje dezinformacija pružanjem diskretnog mehanizma za prepoznavanje slika koje je generirala umjetna inteligencija".

Model može primati upute na engleskom jeziku i razumjeti složene upute kako bi generirao relevantne slike.

📷 Image: Amazon
Image: Amazon

Titan Multimodal Embeddings

Titan Multimodal Embeddings ima sposobnost da obrađuje i generira informacije korištenjem različitih vrsta podataka (modaliteta). To znači da je moguće poslati tekst, sliku ili kombinaciju to dvoje kao unos.

Model unosima daje semantičko značenje i povezuje odnose između podataka tj. na parovima slika-naslov.

Uz asinkroni batch API, Amazon OpenSearch Service će uskoro ponuditi konektor koji dodaje Titan Multimodal Embeddings podršku za neuronsko pretraživanje.