Četrnaesto harvestiranje nacionalne hr. domene
Srce u suradnji s Nacionalnom i sveučilišnom knjižnicom u Zagrebu provodi četrnaesto harvestiranje sadržaja svih web sjedišta na vršnoj .hr domeni
Srce u suradnji s Nacionalnom i sveučilišnom knjižnicom u Zagrebu u sklopu zbirke Hrvatski arhiv weba od 2004. selektivno prikuplja obvezni primjerak online publikacija prema Zakonu o knjižnicama i knjižničnoj djelatnosti. Kako bi se upotpunio opseg arhiviranih online publikacija, četrnaesti put će biti provedeno pobiranje (harvestiranje) sadržaja objavljenog na nacionalnoj domeni .hr u skladu s Pravilnikom o obveznom primjerku.
Harvestiranje cijele domene podrazumijeva prikupljanje svih javno dostupnih sadržaja u zadanome vremenu na aktivnim domenama .hr, .com.hr i .from.hr. Za harvestiranje će se koristiti popis od 134.506 aktivnih domena koji je Nacionalnoj i sveučilišnoj knjižnici dostavila CARNET-ova DNS služba. Očekuje se da će ove godine robot koji provodi harvestiranje prikupiti više od 24,3 TB koliko je preuzeto s weba tijekom harvestiranja 2023. godine. Svi prikupljeni sadržaji bit će javno dostupni u sklopu stranica Hrvatskoga arhiva weba, a putem kojih su dostupna i sva prethodna harvestiranja.
Robot koji provodi harvestiranje dolazi sa servera u Srcu s IP adrese 61.53.3.11 i predstavlja se kao Mozilla/5.0 (compatible; heritrix/3.6.x; + https://haw.nsk.hr/cesta-pitanja/) i pridržava se pravila koje vlasnici webova definiraju pomoću robots.txt datoteka.