„Mogu li strojevi misliti?“ — pitanje koje je još 1950. godine postavio Alan Turing, aktualno je i danas. Machine learning, artificial intelligence, data mining, big data neki su od pojmova koji svakodnevno pune naslovnice tehnoloških portala. No, iako se čini kako su navedeni koncepti nedavno otkriveni — njihova povijest seže daleko u prošlost.

Alan Turing u znanstvenom radu objavljenom 1950. godine spominje pojam inteligentnog stroja te definira uvjete koje bi strojevi trebali zadovoljiti kako bi ih se moglo nazivati inteligentnima. Već godinu dana nakon Turingove ideje pojavljuje se prvi „inteligentni“ stroj sastavljen od elektronskih cijevi pod nazivom SNARC.

Machine learning (strojno učenje) je tehnika podatkovne analize koja računalima omogućava sposobnost učenja iz postojećih podataka.

Iako je strojno učenje kompleksan koncept čije razumijevanje zahtjeva dobro poznavanje matematičke analize, linearne algebre i statistike, postoje okviri i okruženja koji olakšavaju implementaciju algoritama. Kao vodeća online platforma nameće se Azure Machine Learning Studio.

Na rapidan rast strojnog učenja utjecalo je povećanje dostupnosti podataka i pad cijena računalnog hardvera. Velik broj podataka trenutno je u opticaju, ali neorganizirane podatke teško je pretvoriti u informacije od značaja za poslovanje.

Jedan od najvećih izazova s kojima se susreću saloni rabljenih vozila je određivanje cijene automobila s obzirom da isto zahtjeva veliko znanje i veliki vremenski utrošak. Takve kompanije imaju podatke o prijašnjim prodajama automobila uključujući i njihove karakteristike i cijenu, ali bez definiranog modela teško je izvesti zaključke o korelaciji podataka. Korištenjem machine learninga može se provesti analiza prethodnih prodaja i izraditi model koji će predvidjeti cijenu automobila ako mu se daju karakteristike istog.

Rasprostranjenosti umjetne inteligencije svjedoči i zajednički projekt najvećih tehnoloških kompanija (Microsoft, Apple, Amazon, Google, Facebook, IBM) čiji je cilj uspostavljanje standarda i podizanje razine svijesti o umjetnoj inteligenciji.

Budućnost strojnog učenja

Open Worm

Jedan od najzanimljivijih i najznačajnijih machine learning projekata zasigurno je Open Worm —projekt otvorenog koda čiji je cilj izraditi potpuni računalni model jednostavnog crva koji obavlja zadatke poput hranjenja, pronalaska partnera i izbjegavanja predatora.

U pitanju je crv naziva Caenorhabditis elegans kojeg biolozi proučavaju već desetljećima, a 2012. godine postao je i prvi organizam kojem su mapirane sve neuronske veze. Realizacija ovog projekta predstavlja temelj za razumijevanje ponašanja živih bića.

General artificial intelligence

Računala koja igraju Tetris, Pong ili Pacmana svakako zvuče zanimljivo. No, pravi je izazov računalu usaditi koncepte samo jedne od ovih igara, a da to isto računalo samo primjeni stečeno znanje (iskustvo) i na ostale igre. Upravo ovakvom načinu učenja teži područje umjetne inteligencije nazvano opća umjetna inteligencija. Konačan cilj je razvoj modela koji bi stroju usadio inteligenciju koja bi po karakteristikama odgovarala onoj koju posjeduje čovjek. Po prognozama znanstvenika, sljedeće desetljeće obilježiti će razvoj opće umjetne inteligencije.

Azure Machine Learning

Azure Machine Learning Studio je interaktivno okruženje u oblaku koje na jednostavan način omogućuje izradu modela kroz sve faze — transformacija podataka, primjena algoritma, treniranje modela i evaluacija modela. Cijeli proces odvija se preko grafičkog drag&drop sučelja.

Azure Machine Learning Studio dostupan je besplatno uz određene limite koji ne bi trebali predstavljati problem ni zahtjevnijim korisnicima. Za naprednije korisnike tu je klasičan model naplate — proporcionalno vremenu i intenzitetu korištenja servisa.

Servis sadrži mnoštvo primjera — prepoznavanje rukopisa; detekcija raka dojke; predviđanje kašnjenja letova – uz podatke preuzete iz besplatno dostupnih izvora.

Proces strojnog učenja sastoji se od nekoliko koraka; prvi i najbitniji korak je „postavljanje pravog pitanja“, odnosno određivanje cilja eksperimenta. Slijedi prikupljanje i transformacija podataka koja je u većini slučajeva i vremenski najzahtjevniji proces. Podaci su ključna stavka svakog machine learning eksperimenta, a osim količine istih, bitna je i njihova kvaliteta. Azure Machine Learning Studio pojednostavljuje proces transformacije podataka primjenom modula za procesuiranje podataka kao što su filtracija, normalizacija i grupiranje. Nakon procesuiranja podataka potrebno je trenirati model koristeći odgovarajući algoritam te isti evaluirati kako bi se dobila predodžba o njegovoj uspješnosti.

Microsoft Cognitive Toolkit

Početkom 2016. godine Microsoft je izdao Microsoft Cognitive Toolkit —okruženje otvorenog koda specijalizirano za deep learning (dubinsko učenje) kojeg odlikuju brzina i skalabilnost (CPU ili GPU) te pouzdanost i portabilnost.

Toolkit sadrži Python i C++ biblioteke, a može se koristiti i kao samostalan alat — korištenjem Microsoftovog jezika BrainScript. Microsoft je najavio podršku i za ostale popularne programske jezike u skoroj budućnosti.

Iako je javnosti predstavljen tek nedavno, ovaj set alata, razvijen od strane Microsoft Research tima, Microsoft već godinama koristi u raznim proizvodima — Cortana (razumijevanje), Bing (prijedlozi), Xbox (matchmaking) i HoloLens (prepoznavanje objekata).

Microsoft cognitive services

Uz Azure Machine Learning Studio, Microsoft nudi i servis pod nazivom Microsoft Cognitive Services, koji sadrži robusne module za analitiku govora, slika i jezika, a iste je moguće integrirati u aplikacije korištenjem samo nekoliko linija koda.

Servis je namijenjen korisnicima koji bez ulaganja u infrastrukturu žele iskoristiti prednosti strojnog učenja.

Primjene machine learninga

Machine learning pogoni razne tehnologije koje su danas sastavni dio života svih ljudi. Modeli za detekciju neželjene pošte, prepoznavanje rukopisa i analizu financijskog tržišta odavno se treniraju pomoću machine learninga, a u posljednjih nekoliko godina machine learning nalazi primjenu u pomalo neočekivanim segmentima pa su tako razvijeni modeli za skladanje glazbe, generaciju slika i medicinske dijagnoze.
Nemojte dopustiti da vaši podaci trunu u arhivi — postanite dio najbrže rastuće industrije korištenjem Azure Machine Learning Studia