Sveučilišni računski centar (Srce) je održao konferenciju za novinare na kojoj su predstavili što su naučili o hrvatskom webu u proteklih 15 godina.

Srce se istraživanjem tehnologija i informacijskog prostora weba bavi dugi niz godina, a poticaj za ovaj projekt došao je kroz suradnju Srca i Nacionalne i sveučilišne knjižnice (NSK) na projektu “Nacionalni informacijski sustav knjižnica Republike Hrvatske – NISKA”. Cilj je bio izmjeriti hrvatski web2, odnosno prikupiti informacije o veličini i sadržaju hrvatskoga prostora weba.

Prvo je mjerenje izvedeno korištenjem programske podrške razvijene u Srcu. Započelo je 29. ožujka i trajalo sve do 7. svibnja 2002. godine. Nakon prvog, nastavila su se unapređivati i provoditi mjerenja sve do 2008. godine kada je u proljeće dovršeno posljednje mjerenje weba, čiji su rezultati predstavljeni pod oznakom projekta MWP6. Kroz ukupno provedenih šest mjerenja stručni je tim prikupio znanja i iskustva koja su omogućila uspješnu suradnju s NSK na projektu izgradnje Hrvatskog arhiva weba (HAW) i s Hrvatskom informacijsko-dokumentacijskom referalnom agencijom (HIDRA, danas Središnji državni ured za razvoj digitalnog društva) na projektu arhiva DAMIR.

Oba su arhiva u produkcijskom radu više od 10 godina. Izgrađeni su korištenjem programske podrške DAMP (Digitalni arhiv mrežnih publikacija) koja je razvijena u Srcu. HAW je arhiv čija je svrha preuzimanje i trajno čuvanje publikacija s interneta kao dijela hrvatske kulturne baštine te je po tome jedinstven u Hrvatskoj i svijetu. Nema drugog internetskog servisa koji bi jednakim obuhvatom, sustavno arhivirao sadržaje s hrvatskog weba i nudio im otvoreni pristup. Arhiv DAMIR prikuplja i čuva sadržaje koji su javnosti dostupni kroz internetske usluge Središnjeg državnog ureda za razvoj digitalnog društva. Oba su arhiva danas udomljena na računalnoj opremi Srca pri čemu stručni tim Srca u suradnji s njihovim vlasnicima skrbi o njihovom radu i razvoju.

Mjerenje weba, od 2011. godine, zamijenjeno je harvestiranjem. Naime, od te se godine, u okviru HAW-a, pomoću programske podrške Heritrix modificirane u Srcu, provode redovita godišnja harvestiranja – prikupljanja i arhiviranja javno dostupnih sadržaja s hrvatskog prostora weba. Harvestiraju se aktivna sjedišta weba na nacionalnoj internetskoj domeni .hr u pravilu krajem kalendarske godine. Harvestiranje je aktivnost komplementarna selektivnom pobiranju sadržaja koje se u okviru HAW neprekidno provodi od samog početka 2004. godine.

Pomoćnik ravnatelja za informacijsku i posredničku infrastrukturu, Miroslav Milinović, istaknuo je kako je složenost i dinamičnost informacijskoga prostora weba predstavljala na samom početku prije 15 godina, izazov kao i danas. Web su već tada uspoređivali sa santom leda kojoj je vidljivi, površinski i jednostavno dohvatljivi dio (engl. surface web) bitno manji od nevidljivog, teško dostupnoga dijela (engl. invisible, deep web).

Podijeli:

 

Vezane objave