Automatizirano dobivanje podataka s weba - Automatika narodu

Područje automatiziranog sustavnog pretraživanja weba svakim danom dobiva sve veću važnost, jer količina na webu dostupnih informacija raste te informacije postaju sve vrednije. Više informacija i bolje informacije od iznimne su važnosti za donošenje poslovnih odluka, zbog čega je korisno znati kako (automatizirano) doći do većih količina informacija na Internetu te kako izvući i obraditi tražene informacije

Domagoj Marić, Megatrend poslovna rješenja petak, 17. srpnja 2020. u 14:00

Što je to web-scraping? Dvije glavne definicije u području ekstrakcije web-sadržaja su web-scraping i web-crawling. Web-scraping jest sistematizirana ekstrakcija sadržaja (tekstualnog ili medijskog) s web-stranica, postignuta korištenjem alata zvanih web-scraperi. Koncept web-scrapinga temelji se na korištenju metoda web-crawlinga, automatiziranog sustavnog pretraživanja weba, postignutog praćenjem poveznica web-stranica pomoću web-crawlera.
Procesi web-scrapinga i web-crawlinga čine kontinuirani ciklus: crawlingom dolazimo do HTML dokumenata iza web-stranica, iz kojih izvlačimo željeni sadržaj i poveznice na ostale web-stranice pomoću scrapinga te dalje vršimo crawling po prikupljenim poveznicama.Zašto web-scraping? Poduzećima web-scraping pomaže na mnogo načina. Najčešće je riječ o analizi kompetitivnosti cijena i motrenju konkurencije te istraživanju tržišnih scenarija (trendova) prije plasiranja usluge ili proizvoda na tržište. Osim toga, dodatni agregirani podaci s weba uvijek dobro dođu i u raznim područjima umjetne inteligencije.

Članak dostupan pretplatnicima

Kako bi mogao pročitati cijeli članak, moraš biti prijavljen na Bug.hr sa svojim podacima te imati status pretplatnika.

Registriraj se Prijavi se

Mreza 8-9 / 2020 kolovoz-rujan 2020.

Prethodna tema Sljedeća tema

Automatizirano dobivanje podataka s weba - Automatika narodu

Članak dostupan pretplatnicima

Vezano

Vrhunski hi-fi zvuk uz najbolje popuste!

KEF Q7 Meta

DALI KUPID Black Ash

PRO-JECT E1.2, , PICK IT, MM

KEF Coda W Dark Titanium

Bluesound PowerNode N331

WiiM Ultra

Ronis Velesajam

Trenutno najpovoljnije cijene na tržištu

Vezano

Umjetna inteligencija

Računalni vid - AI popravlja "dioptriju" računalnom vidu

Mreža na terenu

3T – Tourism, Travel and Tech - Turizam u sve toplijem svijetu

PROMO

Megatrend poslovna rješenja - 35 godina inovacija

edukativni web portal

Prometna edukacija djece kroz projekt 'Prometna abeceda'

AI Mode & AI Overviews

Kako zaobići AI prilikom pretraživanja weba u Google Chromeu

Popis za bookmark

50 korisnih web-stranica i servisa za svaku priliku - Internetski alati