Berta Sándor
Már 30 petabájt adatot tárol az Internet Archívum
A létesítmény mindent megőriz arról, ami a világhálón zajlik, legyen szó macskavideókról, kínos partifotókról vagy más anyagokról.
Az Internet Archívum épülete San Francisco északi részén található és 2009-ig egy egyházé volt. Az elmúlt években azonban már egyre inkább egy digitális alexandriai könyvtárra hasonlít, amely mindenki számára és bármikor hozzáférhető. Ahol egykor miséket tartottak, most szerverek tucatjai állnak. Az adatbázis jelenleg több mint 30 petabájt adatot tárol, a gyűjtemény része 300 milliárd honlap, 12 millió könyv, 4 millió audiofelvétel, 3,3 millió videó, 1,5 millió digitális fotó és 170 000 szoftver. De a szervezet nem csupán az internet örökségét akarja megőrizni, hanem analóg tartalmakat, könyveket, dalokat és filmeket is digitalizálna, majd elérhetővé tenne a felhasználók számára.
Az archívumot az 1990-es évek közepén hozta létre Brewster Kahle informatikus azzal a céllal, hogy lehetőleg minden valaha megjelent honlapot megőrizzen az utókor számára. A férfi 25 évvel ezelőtt egy böngészőt fejlesztett ki, majd eladta azt az AOL-nek, míg az Alexa Internet nevű online szolgáltatását 1999-ben 250 millió dollárért az Amazon vásárolta meg. 20 éve vezeti a könyvtárat, amelynek mottóját így foglalta össze: univerzális hozzáférés a világ minden tudásához.
Az archívum kulcsa a Wayback Machine, amely digitális időutazást tesz lehetővé és a segítségével egészen 1996-ig lehet visszamenni az időben. A 300 milliárd honlap aktuális változatait minden második hónapban lementik. A Kahle által kifejlesztett Alexa online ranglista szerinti legfontosabb oldalakat naponta többször is rögzítik. A lementett tartalmak között van például a The New York Times 2001. szeptember 11-i honlapja, a Grateful Dead nevű rockegyüttes 1971-es koncertje a Hollywood Palladiumban; egy videó, amelyet az Apollo-11 űrhajósai készítettek a napfelkeltéről a Földön; a Casablanca forgatókönyve, egy kép Marilyn Monroeról, valamint számítógépes játékok (The Oregon Trail, Winter Games, Strip Poker 2 Plus).
Az Internet Archívum a világ 300 leglátogatottabb portálja között van, amelynek a munkáját 100 alkalmazott és több mint 1000 önkéntes segíti. Kahle elmondta, hogy az interneten jelenlévő tartalom több millió ember idejének és erőfeszítéseinek eredménye. Hangsúlyozta, hogy nem lehet tudni, hogy mi lesz majd fontos akkor, amikor a jövőbeli emberek a jelent fogják megítélni. Egy amatőr film vagy egy pillanatkép ugyanolyan sokat mesélhet el a mostani korról, mint egy regény.
A digitális archívum nem csupán a történészek számára érdekes, hanem a bűnüldözőknek is. A Szövetségi Nyomozó Iroda (FBI) már eddig is több kéréssel fordult a létesítményhez. Az üzemeltetők ugyanakkor naponta több levelet kapnak azzal kapcsolatban, hogy töröljenek bizonyos tartalmakat. Ezeket a kéréseket általában teljesítik.
Kahle ragaszkodik ahhoz, hogy az adatbázis anyagai ne egy IT-óriás magángyűjteményébe kerüljenek majd, hanem a köztudást gyarapítsák. Egyetlen dolog miatt aggódik, hogy a történelem során szinte minden bibliotékát megsemmisítettek a különböző kormányok. Ez nem politikai kinyilatkoztatás, hanem tény. Amennyiben az alexandriai könyvtár anyagairól lettek volna másolatok, akkor azok még most is megtekinthetők lennének. Éppen ezért készítettek minden egyes tárolt fájlról másolatot és az adatbázis egyes verziói megtalálhatók a kaliforniai Richmondban, Amszterdamban, Alexandriában és hamarosan Kanadában is. Az Internet Archívum költségvetése egyébként évente kicsit több mint 10 millió dollár.
Az Internet Archívum épülete San Francisco északi részén található és 2009-ig egy egyházé volt. Az elmúlt években azonban már egyre inkább egy digitális alexandriai könyvtárra hasonlít, amely mindenki számára és bármikor hozzáférhető. Ahol egykor miséket tartottak, most szerverek tucatjai állnak. Az adatbázis jelenleg több mint 30 petabájt adatot tárol, a gyűjtemény része 300 milliárd honlap, 12 millió könyv, 4 millió audiofelvétel, 3,3 millió videó, 1,5 millió digitális fotó és 170 000 szoftver. De a szervezet nem csupán az internet örökségét akarja megőrizni, hanem analóg tartalmakat, könyveket, dalokat és filmeket is digitalizálna, majd elérhetővé tenne a felhasználók számára.
Az archívumot az 1990-es évek közepén hozta létre Brewster Kahle informatikus azzal a céllal, hogy lehetőleg minden valaha megjelent honlapot megőrizzen az utókor számára. A férfi 25 évvel ezelőtt egy böngészőt fejlesztett ki, majd eladta azt az AOL-nek, míg az Alexa Internet nevű online szolgáltatását 1999-ben 250 millió dollárért az Amazon vásárolta meg. 20 éve vezeti a könyvtárat, amelynek mottóját így foglalta össze: univerzális hozzáférés a világ minden tudásához.
Az archívum kulcsa a Wayback Machine, amely digitális időutazást tesz lehetővé és a segítségével egészen 1996-ig lehet visszamenni az időben. A 300 milliárd honlap aktuális változatait minden második hónapban lementik. A Kahle által kifejlesztett Alexa online ranglista szerinti legfontosabb oldalakat naponta többször is rögzítik. A lementett tartalmak között van például a The New York Times 2001. szeptember 11-i honlapja, a Grateful Dead nevű rockegyüttes 1971-es koncertje a Hollywood Palladiumban; egy videó, amelyet az Apollo-11 űrhajósai készítettek a napfelkeltéről a Földön; a Casablanca forgatókönyve, egy kép Marilyn Monroeról, valamint számítógépes játékok (The Oregon Trail, Winter Games, Strip Poker 2 Plus).
Az Internet Archívum a világ 300 leglátogatottabb portálja között van, amelynek a munkáját 100 alkalmazott és több mint 1000 önkéntes segíti. Kahle elmondta, hogy az interneten jelenlévő tartalom több millió ember idejének és erőfeszítéseinek eredménye. Hangsúlyozta, hogy nem lehet tudni, hogy mi lesz majd fontos akkor, amikor a jövőbeli emberek a jelent fogják megítélni. Egy amatőr film vagy egy pillanatkép ugyanolyan sokat mesélhet el a mostani korról, mint egy regény.
A digitális archívum nem csupán a történészek számára érdekes, hanem a bűnüldözőknek is. A Szövetségi Nyomozó Iroda (FBI) már eddig is több kéréssel fordult a létesítményhez. Az üzemeltetők ugyanakkor naponta több levelet kapnak azzal kapcsolatban, hogy töröljenek bizonyos tartalmakat. Ezeket a kéréseket általában teljesítik.
Kahle ragaszkodik ahhoz, hogy az adatbázis anyagai ne egy IT-óriás magángyűjteményébe kerüljenek majd, hanem a köztudást gyarapítsák. Egyetlen dolog miatt aggódik, hogy a történelem során szinte minden bibliotékát megsemmisítettek a különböző kormányok. Ez nem politikai kinyilatkoztatás, hanem tény. Amennyiben az alexandriai könyvtár anyagairól lettek volna másolatok, akkor azok még most is megtekinthetők lennének. Éppen ezért készítettek minden egyes tárolt fájlról másolatot és az adatbázis egyes verziói megtalálhatók a kaliforniai Richmondban, Amszterdamban, Alexandriában és hamarosan Kanadában is. Az Internet Archívum költségvetése egyébként évente kicsit több mint 10 millió dollár.