A harmadik alkalommal megrendezett 404 Not Found - Ki őrzi meg az internetet? szakmai napnak a célja feltérképezni a webes tartalmak archiválásának lehetőségeit és határait – mondta el Hammerstein Judit, az OSZK megbízott főigazgatója a tanácskozás kezdetén.
Az elmúlt mintegy két évtizedben nagyon sok értékes tartalom csak online formában jelent meg, de ha volt nyomtatott változat is, egyáltalán nem biztos, hogy a kettő megegyezik egymással. Ezek a webes tartalmak archiválás nélkül idővel eltűnésre vannak ítélve – tette hozzá.
A teljes magyar internet archiválása egyetlen országos szintű intézmény számára sem lehetséges. Jelenleg 4600 online hírportál, napilap és időszakos kiadvány lementése tűnik megoldhatónak rendszeresen, évente pár alkalommal. A lementett webes tartalmak elérhetőek lesznek az Országos Könyvtári Platformon (OKP) belül.
Latorcai Csaba, az Emberi Erőforrások Minisztériuma közigazgatási államtitkára kiemelte: 2006-ban merült fel először a magyar weboldalak tömeges archiválásának ötlete, amely 2016-ban bekerült az Országos Könyvtári Platform (OKP) 10 milliárd forintos fejlesztésének elemei közé is.
A 2017-ben indult webarchiválási tesztprojektben 2018 decemberében 291 ezer magyar domain cím tartalmát mentették le. A technikai háttér tehát már létezik, a következő lépés a stabil jogszabályi és költségvetési támogatás kidolgozás.
A tervek szerint az OSZK-nak 2021-től el kell tudnia látni a magyar vonatkozású webtartalmak mentésének, feldolgozásának, hosszú távú megőrzésének és webarchívumba rendezésének feladatát. Az internet legkomplexebb médium, amellyel az elmúlt több száz évben valaha is találkoztak a közgyűjtemények. A web egyre nagyobb részét teszik ki a különböző szoftverek, ezért elképesztően nehéz az archiválása – hangsúlyozta Drótos László főkönyvtáros a konferencián.
A webarchiválási tesztprojektben 2018-ban mintegy 20 ezer webhelyet, 29 terabájt összméretű adatot mentettek le. Az eltárolt fájlok/URL-címek száma megközelíti az 500 milliót. Idén decemberben egy ennél is nagyszabásúbb „aratásra” készülnek. A tanácskozáson szó lesz egyebek mellett az online sajtócikkek adatbázisba rendezéséről, a webhelyek metaadatolási problémáiról, valamint az OSZK országos projektjén belüli, helyi érdekű webarchiválási lehetőségekről is.