A közgyűjtemények webarchiválási feladatairól tanácskoznak az Országos Széchényi Könyvtárban (OSZK) csütörtökön Budapesten.

A
harmadik alkalommal megrendezett 404 Not
Found - Ki őrzi meg az internetet?
szakmai napnak a célja feltérképezni a
webes tartalmak archiválásának lehetőségeit és határait – mondta el Hammerstein
Judit, az OSZK megbízott főigazgatója a tanácskozás kezdetén.

Az
elmúlt mintegy két évtizedben nagyon sok értékes tartalom csak online formában
jelent meg, de ha volt nyomtatott változat is, egyáltalán nem biztos, hogy a
kettő megegyezik egymással. Ezek a webes tartalmak archiválás nélkül idővel
eltűnésre vannak ítélve – tette hozzá.

A teljes magyar internet archiválása egyetlen országos szintű intézmény számára sem lehetséges. Jelenleg 4600 online hírportál, napilap és időszakos kiadvány lementése tűnik megoldhatónak rendszeresen, évente pár alkalommal. A lementett webes tartalmak elérhetőek lesznek az Országos Könyvtári Platformon (OKP) belül.

Latorcai
Csaba, az Emberi Erőforrások Minisztériuma közigazgatási államtitkára kiemelte:
2006-ban merült fel először a magyar weboldalak tömeges archiválásának ötlete,
amely 2016-ban bekerült az Országos Könyvtári Platform (OKP) 10 milliárd
forintos fejlesztésének elemei közé is.

A
2017-ben indult webarchiválási tesztprojektben 2018 decemberében 291 ezer
magyar domain cím tartalmát mentették le. A technikai háttér tehát már létezik,
a következő lépés a stabil jogszabályi és költségvetési támogatás kidolgozás.

A
tervek szerint az OSZK-nak 2021-től el kell tudnia látni a magyar vonatkozású
webtartalmak mentésének, feldolgozásának, hosszú távú megőrzésének és
webarchívumba rendezésének feladatát. Az internet legkomplexebb médium,
amellyel az elmúlt több száz évben valaha is találkoztak a közgyűjtemények. A
web egyre nagyobb részét teszik ki a különböző szoftverek, ezért elképesztően
nehéz az archiválása – hangsúlyozta Drótos László főkönyvtáros a konferencián.

A
webarchiválási tesztprojektben 2018-ban mintegy 20 ezer webhelyet, 29 terabájt
összméretű adatot mentettek le. Az eltárolt fájlok/URL-címek száma megközelíti
az 500 milliót. Idén decemberben egy ennél is nagyszabásúbb „aratásra”
készülnek. A tanácskozáson szó lesz egyebek mellett az online sajtócikkek
adatbázisba rendezéséről, a webhelyek metaadatolási problémáiról, valamint az
OSZK országos projektjén belüli, helyi érdekű webarchiválási lehetőségekről is.