Ki ne találkozott volna még azzal a lehangoló internetes jelenséggel, amikor egy tartalmat keresünk, rátalálunk egy cikkre, de elszántságunkra fittyet hányva az oldal csak annyit ír ki: ?404 ? Page Not Found?? Ilyenkor a felhasználó ? kissé lefelé görbülő szájjal ? kénytelen visszatérni a keresőbe, és folytatni a kutatást reménykedve egy hasznosabb végkifejletben. Ez a jelenség a tudományos munkát is komolyan érinti, hiszen sokan használunk interneten megjelent cikkeket hivatkozásként.
Az Országos Széchényi Könyvtárban 2017 tavaszában indult el egy kezdeményezés bizonyos webtartalmak archiválására kulturális, tudományos, oktatási és közéleti témakörökben. Az archiválandó webtartalmak között szerepelnek a magyar domain névvel rendelkező elektronikus újságok, folyóiratok, hírportálok, blogok, de a külföldi szervereken levő, magyar vonatkozású webhelyek is. ?A Z-generáció életében a levéltári hagyatékok az interneten lesznek elérhetőek és nem papírformában, legalábbis nem minden tekintetben. Óriási kihívás ilyen szempontból az emlékek megőrzésének kérdése? ? mondta Tüske László, az OSZK főigazgatója a november 15-ei szakmai nap megnyitásaként.
A rendezvényt dr. Latorcai Csaba, az Emberi Erőforrások Minisztériumának közigazgatási államtitkára nyitotta meg, aki beszédében elmondta: ?A felnövekvő generációk számára nélkülözhetetlen eszköz, a mindennapi kapcsolattartás elsődleges platformja az internet.? Éppen ezért, ahogy az államtitkár hangsúlyozta ?a nyomtatott kiadványok korára jellemző megőrzési technikákat ki kell egészíteni a digitális kor lenyomatának megőrzését biztosító megoldásokkal?. Kiemelte, hogy a könyvtárak szakemberei között már létrejött egy szakmai konszenzus arról, hogy szükség van az interneten keletkező tartalmak összegyűjtésére, tárolására és visszakereshetőségére. Az államtitkár szólt a webarchiválás jogszabályi hátteréről is, amelynek megteremtése, kidolgozása is folyamatban van.
A 2018-as év végén záruló, az Országos Könyvtári Rendszer (OKR) keretén belül zajló webarchiválási pilot projektről, annak eredményeiről Drótos László témafelelős tartott előadást. Elmondta, hogy a webarchiválás kétféleképpen zajlik: rendszeresen letölthetnek egyes kiválogatott webhelyeket, illetve begyűjthetik a híreket a kiemelten fontos eseményekről. Az előbbi érinti például múzeumok, galériák, könyvtárak, levéltárak, egyetemek, kutatóintézetek honlapjait, az eseményalapú archiválás pedig vonatkozhat például a téli olimpiával vagy az országgyűlési választásokkal kapcsolatos tartalmakra. A szűrés azonban roppant nehéz, ahogy az előadó is elmondta: a rendelkezésre álló nemzeti (.hu) domain nevek közül nem mindegyik aktív, bizonyosakat pedig csak belső levelezésre használnak, így azok tartalma sem nyilvános. Mi több, a magyar vonatkozású oldalakhoz más nemzetiségű domain név is társulhat.
Az első komolyabb teszt 2017 áprilisában indult: mintegy 40 millió linkről négy terabájtnyi digitális objektumot töltöttek le. A begyűjtéshez és archiváláshoz többek között a Heritix, az OpenWayBack, és a Web Curator Tool nevű külföldi szoftvereket használják. Ahogy Drótos László elmondta, előadásokat tartanak külföldön és belföldön, publikálnak, és tartják a kapcsolatot a nemzetközi webarchívumokkal, külföldi és hazai intézményekkel, szervezetekkel is.
?A nemzetközi gyakorlat az, hogy a weben található információ mennyiséget minél több archiváló könyvtár gyűjti. Tevékenységük már nemcsak a nyomtatott ? analóg ? dokumentumok gyűjtésére, őrzésére és feldolgozására terjed ki, hanem magába foglalja azokat az információhordozókat is, amelyeket az új világ ? a digitália ? ad nekünk. Ez az internet világa? ? mondta Tüske László főigazgató a Kultúra.hu-nak adott interjújában. A webarchiválás kérdése akkor merült fel programszerűen a magyar nemzeti könyvtárban, amikor elindították a könyvtár információs rendszerének megújítására irányuló projektet. ?Ahogy a világ, úgy mi sem mondhattunk le ennek az információforrásnak a megőrzéséről? ? tette hozzá.
A főigazgató hangsúlyozta: az is nemzetközi tapasztalat, hogy a webarchiválás tekintetében megkülönböztetik a válogatott (szelektíy) és a teljes mentést. A szelektív mentés egy adott webtér bizonyos szakterületeinek válogatott honlapjait gyűjti. ?Ezen kívül a világ többi webarchívuma körében általános gyakorlat, hogy évente egyszer vagy kétszer az összes nemzeti domain név alatt futó honlapot lementik? ? magyarázta az igazgató. A magyar nemzeti könyvtár is ezt a gyakorlatot veszi át. ?A kialakuló gazdag forrásanyagban újszerűnek tűnő kutatási problémák lesznek majd a jövőben, de talán csak technikai tekintetben. Ez ugyanolyan lesz majd, mint ahogy most a 18. század különböző eseményei, híradásai, fél-információi között próbálunk koherens rendet teremteni. Magyarázatot találni az összefüggésekre, kapcsolódásokra stb. Nem a papír lesz az adathordozó, hanem a digitális tér, és a kutatók ebben fognak sétálgatni majd?.
Tüske László a Kultúra.hu-nak elmondta azt is, hogy ez a projekt becsatlakozik majd az Országos Könyvtári Platform programba (OKP), amelynek első változatát előreláthatólag 2021-ben fogják megnyitni a nyilvánosság előtt. ?Az elképzelés az, hogy ekkorra a webarchiválási projekt is felfejlődik annyira, hogy már a szolgáltatások részére is meg tudjuk nyitni? ? magyarázta az igazgató. Hozzátette: az informatikusok és a könyvtárasok összeadott tudásával lementett anyagot tudják majd prezentálni. ?Abban a pillanatban, hogy a szolgáltatás számára is megnyitjuk a gyűjteményt, már nem csak a kutatók, hanem bárki hozzájuk férhet. A szolgáltatás bevezetése előtt természetesen beszerezzük a szükséges hozzájárulásokat és engedélyeket a honlapok tulajdonosaitól. Ennek jogászaink alaposan utánajárnak? ? tette hozzá.
Kiemelte, hogy a projekt jelenleg tartó fázisa idén év végén lezárul, a további fejlesztésekkel vásárlásokkal, együttműködésekkel azonban tovább fog fejlődni és bevonja az egész magyar könyvtári rendszert, amelynek részére szolgáltatást kíván majd nyújtani a 2021-es induláskor. Hozzátette: már most nemzetközi sajtómegjelenéseik vannak, elméleti szinten és kísérleti szinten is a világszínvonalon van a projekt. ?Fenntartását a kormányzat támogatása biztosítja, és bízunk benne, hogy ez továbbra is a rendelkezésünkre áll, és mindennapjaink részévé válik az internetes múlt követésének lehetősége is? ? fűzte hozzá.
Az első szakmai napot 2017-ben tartotta meg az Országos Széchényi Könyvtár, amelyen szintén az OKR programba pilot projektként beépülő webaratás teszteléséről esett szó. Az idén november 15-én megrendezett 404 Not Found ? Ki őrzi meg az internetet? című szakmai nap ennek a folytatása és a tervek szerint a következő években is számíthatunk hasonló előadásokra, kerekasztal-beszélgetésekre, beszámolókra a szakmai napok keretében. Az OSZK webarchiválási projektjének honlapja ITT található: a honlapon meg lehet tekinteni a demo verziót a már összegyűjtött oldalakról, valamint egy űrlap kitöltésével javaslatokat is be lehet nyújtani archiválásra, megőrzésre érdemes magyar vagy pedig magyar vonatkozású külföldi webhelyekre.
Az OSZK informatikai rendszerének stabilizálására, fejlesztésére 7,5 milliárd forint, a fejlesztés eredményeként létrejövő rendszer működtetésére, fenntartására tavaly több mint egy milliárd forint, idén pedig több mint 1,3 milliárd forint támogatást biztosít a kormány.
Révy Orsolya
Fotók a szakmai napról: Országos Széchényi Könyvtár Facebook-oldala