Úti jelentés

Tárgy: Webarchiválási tutoriál az Osztrák Nemzeti Könyvtárban


Bécsben, szeptember 22-én egy szakmai találkozón vettünk részt, amelyet az Osztrák Nemzeti Könyvtárban szerveztek. Az OSZK részéről Renkecz Anita (Digitális Gyűjtemény Osztály), Kovács Péter (Informatikai Osztály) valamint jómagam, Moldován István (Digitális Gyűjtemény Osztály) volt jelen. A találkozón kb. 15-20 fő vett részt, a cseh, a német, a spanyol nemzeti könyvtárból, az USA-ból a Kaliforniai Digitális Könyvtárból.

A találkozót webarchiválással kapcsolatos szakértők tartották, akik a dán Netarchive.dk projektet, a francia valamint az osztrák Nemzeti Könyvtárat képviselték. A találkozó célja a dán NetarchiveSuite szoftverrel való ismerkedés, gyakorlás volt.

A találkozó első részében a dán, az osztrák és a francia webarchiválási gyakorlatot mutatták be röviden. Ezután ismertették a Netarchive.Suite programcsomagot, tulajdonságait, majd a találkozó nagyobbik részében a résztvevők önállóan ismerkedtek, gyakoroltak a szoftverrel.


Dániában
2005-ben kezdtek el foglalkozni a webarchiválással, miután az újonnan életbe lépett kötelespéldányi törvény (New Legal Deposit Law) erre lehetőséget adott. A minél teljesebb archiválás érdekében háromféle módszert is alkalmaznak:

  1. Teljes aratást; évente négyszer.
  2. 80 oldal szelektív aratását, amelyeket gyakran aktualizálnak, vagy különösen fontosak.
  3. Esemény alapján történő aratást, pl. nemzeti, helyi választásokról, olimpiáról.

Az archívumot csak kutatási céllal lehet használni, nem nyilvános.


Ausztriában
2008-tól foglalkoznak webarchiválással. 2009. januárjában fogadtak el egy új média törvényt, amely megteremtette a webarchiválás jogi alapját. Az Osztrák Nemzeti Könyvtár egy átmeneti pilot szakasz után 2010 tavasza óta üzemszerűen menti az osztrák weboldalakat valamint az Ausztriával kapcsolatos külföldi honlapokat (pl. a new york-i Osztrák Kulturális Intézet honlapját). Szintén háromféle archiválást végeznek:

Az archívum a könyvtáron belül szabadon hozzáférhető, valamint 20 másik osztrák könyvtárban.


Franciaországban
2006-ban született törvény az Internet archiválásáról. 2008 szeptemberében a Francia Nemzeti Könyvtár a NetarchivSuite rendszert választotta a webarchiválás menedzselésére dán könyvtárakkal együttműködve. A francia archívumban 1996-tól 2010 augusztusáig 220 Terabyte-nyi adatot archiváltak. Elsőként teljes körű webarchiválással foglalkoztak, de 2010-ben szelektív archiválást is terveznek elindítani: tematikus oldalak mentését.

Jogi korlátozások miatt az archívumhoz csak a könyvtáron belül, engedéllyel lehet hozzáférni.


A NetarchiveSuite szoftvert Dániában, a két nemzeti könyvtár, a Royal Library valamint az Állami és Egyetemi Könyvtár fejlesztette ki, a francia és az osztrák nemzeti könyvtárral együttműködve. Ezt a komplett webarchiválásra alkalmas szoftver-csomagot 2004-ben kezdtek fejleszteni. A program az EU által kifejlesztett Heritrix web-arató alkalmazásra épült, amelyet széles körben használnak weboldalak begyűjtésére. A Netarchive a webarchiválás teljes folyamatát lefedi, a tervezett honlapok listázásától, az ütemezésen át, a futtatásig. Többféle webarchiválás ütemezhető, eseményekre, meghatározott, tematikus domainekre vagy akár egy teljes nemzeti domain-re.


A rövid ismertetések után minden résztvevő egy helyi számítógép elé ülhetett, amelyen telepítették a NetarchiveSuite-t. A tutoriál hátralévő kétharmad idejében különböző honlapok mentését, az alkalmazás beállításait gyakorolhattuk, miközben a fejlesztők képviselői szükség esetén segítettek a program használatában. A szoftver Java alapú, felülete jelenleg angol nyelvű. A résztvevők kaptak ajándékba egy USB pendrive-ot, amelyen egy komplett Ubuntu operációs rendszerre telepítették a NetarchiveSuite menedzselő valamint a Heritrix web-arató szoftvert.


Javaslatok:

A fentiek alapján meggondolandó, hogy akár minimális erőforrásokkal, de mégiscsak elindítsunk egy hazai próba webarchívumot. Az OSZK-ban van informatikai tapasztalat, csak az informatikus kollégánk munkaideje szűkös, egyéb feladatokkal bőven ellátott. A Könyvtári Intézet Web2.0-ás pályázata kapcsán felvetődött, hogy mozgósíthatnánk könyvtárakat egyes, gyűjtőkörükbe tartozó honlapok archiválására. Több országban (pl. Ausztrália) a nemzeti webarchiválást könyvtári konzorciumok végzik több könyvtár együttműködésében. A NetarchiveSuite-t magyarítva, felhasználóbarát felülettel ellátva könyvtárak, könyvtárosok lehetnének mozgósítva elsőként a szelektív, vagy az esemény-archiválásra. Informatikai hátteret nagy valószínűséggel az NIIF biztosítana. Ami szükséges lenne, egy határozott felsővezetői döntés, néhány kijelölt kolléga esetleg részmunkaidőben, akik a feladat szervezését, menedzselését kezdenék el. A feladatokat az erőforrások függvényében bővítenénk, igyekezve bevonni akár könyvtáros hallgatókat is. Mindenképpen fontosnak tartom, hogyha bármely kis lépésekben is, de Magyarországon is induljon el egy folyamatos, intézményi szintű webarchiválási tevékenység.


Említett források:

NetarchiveSuite
http://netarchive.dk/suite

Web@rchive Austria
http://www.onb.ac.at/ev/about/webarchive.htm
http://www.slideshare.net/ATWebarchive/archiving-news-on-the-web

International Internet Preservation Consortium
http://netpreserve.org/about/index.php

Webarchívumok listája
http://netpreserve.org/about/archiveList.php

Budapest, 2010. október 14.

Moldován István
Digitális Gyűjtemény osztály