Berta Sándor

Már 30 petabájt adatot tárol az Internet Archívum

A létesítmény mindent megőriz arról, ami a világhálón zajlik, legyen szó macskavideókról, kínos partifotókról vagy más anyagokról.

Az Internet Archívum épülete San Francisco északi részén található és 2009-ig egy egyházé volt. Az elmúlt években azonban már egyre inkább egy digitális alexandriai könyvtárra hasonlít, amely mindenki számára és bármikor hozzáférhető. Ahol egykor miséket tartottak, most szerverek tucatjai állnak. Az adatbázis jelenleg több mint 30 petabájt adatot tárol, a gyűjtemény része 300 milliárd honlap, 12 millió könyv, 4 millió audiofelvétel, 3,3 millió videó, 1,5 millió digitális fotó és 170 000 szoftver. De a szervezet nem csupán az internet örökségét akarja megőrizni, hanem analóg tartalmakat, könyveket, dalokat és filmeket is digitalizálna, majd elérhetővé tenne a felhasználók számára.

Az archívumot az 1990-es évek közepén hozta létre Brewster Kahle informatikus azzal a céllal, hogy lehetőleg minden valaha megjelent honlapot megőrizzen az utókor számára. A férfi 25 évvel ezelőtt egy böngészőt fejlesztett ki, majd eladta azt az AOL-nek, míg az Alexa Internet nevű online szolgáltatását 1999-ben 250 millió dollárért az Amazon vásárolta meg. 20 éve vezeti a könyvtárat, amelynek mottóját így foglalta össze: univerzális hozzáférés a világ minden tudásához.

Az archívum kulcsa a Wayback Machine, amely digitális időutazást tesz lehetővé és a segítségével egészen 1996-ig lehet visszamenni az időben. A 300 milliárd honlap aktuális változatait minden második hónapban lementik. A Kahle által kifejlesztett Alexa online ranglista szerinti legfontosabb oldalakat naponta többször is rögzítik. A lementett tartalmak között van például a The New York Times 2001. szeptember 11-i honlapja, a Grateful Dead nevű rockegyüttes 1971-es koncertje a Hollywood Palladiumban; egy videó, amelyet az Apollo-11 űrhajósai készítettek a napfelkeltéről a Földön; a Casablanca forgatókönyve, egy kép Marilyn Monroeról, valamint számítógépes játékok (The Oregon Trail, Winter Games, Strip Poker 2 Plus).


Az Internet Archívum a világ 300 leglátogatottabb portálja között van, amelynek a munkáját 100 alkalmazott és több mint 1000 önkéntes segíti. Kahle elmondta, hogy az interneten jelenlévő tartalom több millió ember idejének és erőfeszítéseinek eredménye. Hangsúlyozta, hogy nem lehet tudni, hogy mi lesz majd fontos akkor, amikor a jövőbeli emberek a jelent fogják megítélni. Egy amatőr film vagy egy pillanatkép ugyanolyan sokat mesélhet el a mostani korról, mint egy regény.

A digitális archívum nem csupán a történészek számára érdekes, hanem a bűnüldözőknek is. A Szövetségi Nyomozó Iroda (FBI) már eddig is több kéréssel fordult a létesítményhez. Az üzemeltetők ugyanakkor naponta több levelet kapnak azzal kapcsolatban, hogy töröljenek bizonyos tartalmakat. Ezeket a kéréseket általában teljesítik.

Kahle ragaszkodik ahhoz, hogy az adatbázis anyagai ne egy IT-óriás magángyűjteményébe kerüljenek majd, hanem a köztudást gyarapítsák. Egyetlen dolog miatt aggódik, hogy a történelem során szinte minden bibliotékát megsemmisítettek a különböző kormányok. Ez nem politikai kinyilatkoztatás, hanem tény. Amennyiben az alexandriai könyvtár anyagairól lettek volna másolatok, akkor azok még most is megtekinthetők lennének. Éppen ezért készítettek minden egyes tárolt fájlról másolatot és az adatbázis egyes verziói megtalálhatók a kaliforniai Richmondban, Amszterdamban, Alexandriában és hamarosan Kanadában is. Az Internet Archívum költségvetése egyébként évente kicsit több mint 10 millió dollár.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • TokraFan #22
    A történész az életben nem fogja tudni kiszűrni ebből a rengeteg adatból -melynek a nagyobbik része hulladék es hamis-, a valoban értékeseket, hiteleseket.
  • Cat #21
    Történészi szempontból felbecsülhetetlen értékű lesz. Ne években, hanem évtizedekben gondolkodj. Míg manapság bármikor el tudod olvasni, hogy mit írtak pl. 1945-ben az újságok, mert levéltárakban őrzik a példányokat (vagy mikrofilmen), addig ha pl. az Indexet ugyanúgy bedarálják, mint a Népszabadságot pár nap alatt, fogalma se lesz senkinek, hogy miről volt szó az online térben 2000-ben. És mivel egyébként is megszűnőben/visszaesőben vannak a nyomtatott lapok (csomó már csak online jelenik meg, pl. Newsweek), egyszerűen semmi nem marad meg belőlük a jövő számára.

    Szerintem annyira fontos egy ilyen projekt, hogy egy nemzetközi szervezetnek (pl. ENSZ vagy hasonló) kellene tőkével mögéállnia, ugyanúgy, ahogy a Wikipedia számára is elkelne a segítség.
  • TokraFan #19
    Nem tárolnak el 100% mindent!
    Pl, egy régi, sima HTML honlap anyagából elsősorban a text maradt meg náluk, a beillesztett képek, videok, egyebek már sokszor nincsenek meg az archive.org-on. Általában a főoldal van lementve, így meg lehet nézni, hogyan festett egy honlap 5-10-15évvel korábban. Itt nem arra kell gondolni, hogy pl. a teljes youtube tartalom lementésre kerül.
    Utoljára szerkesztette: TokraFan, 2017.05.26. 13:14:13
  • petrov144 #18
    Azért az megnyugtató, hogy egy olyan érték, mint a "Strip Poker 2 Plus" is benn van az emberiség számára megmentve...
  • duke #17
    " Brewster Kahle informatikus azzal a céllal, hogy lehetőleg minden valaha megjelent honlapot megőrizzen"

    Megvalositotta az emberek regi almat, es letoltotte maganak az internetet :))
    Kivancsi volnek meddig lehet ezt birni adattaroloval. Mert ha igy halad 50 ev mulva a fold osszes atomjat adattarolova kell alakitani.
    Az 1000 ev mulva elo kutatok persze halasak lesznek neki, mar ha addig sikerul megorizni ezeket az adatokat.
  • TokraFan #16
    Ez így van, de jelen esetben tulajdonképpen irreleváns, hogy ki a jogtulajdonos! Mivel az archive.org sem a kép készítőjétől, sem a képen látható embertől nem kér engedélyt a "viszont-közlésre". Az csak technikai kérdés, hogy ki perelhet (a kép készítője, vagy a rajta szereplő ember, ami ahogy írod, országonként változik).
    Az archive.org Jogtalanul készít és tárol másolatokat szerzői jogvédelem alatt álló adatok sokaságáról. Súlyosbító tényező, hogy mindezt a nagynyilvánosság számára, kereshető formában elérhetővé teszi!

    Simán perelhető lenne, ez nem is kérdés...
    Utoljára szerkesztette: TokraFan, 2017.05.25. 18:21:28
  • Macropus Rufus #15
    a gond ott van, hogy pl. az amerikai szerzői jog teljesen más mint a magyar.
    A lenti példámnál maradva: ha te a jenkiknél készítesz egy képet xy-ról azt akkor és ott teszed közzé amikor akarod, ui. a közzétételi jog a kép készítőjénél van. Nálunk meg a képen szereplő emberek engedélye nélkül nem közölhető le sehol a kép. 100%-k, hogy nem jártak utána, hogy milyen szerzői jogi törvények vannak az usán kívül is.
  • Macropus Rufus #14
    pl. a magyar szerzői jog értelmében egy kép publikálási joga nem a kép készítőjénél van hanem a képen szereplő embereknél.
    Tehát a képen szereplő emberek beleegyezése nélkül a tartalom nem közölhető. Ez vonatkozik mindenre, még fészbúkra is.
    Sőt: pont nálunk volt egy per, hogy valaki egy iwiw-ről vet képet használt fel egy cikkébe és vesztette a pert. Mivel amiért a kép fel van töltve egy nyilvános oldalra az még nem jelenti, hogy a szerzői jogok megszűnnek ebben az esetben. Tehát igen is perelhető a cég.
    Gyak. minden olyan adat ami jogköteles (pl. fotók, képek, írott tartalom, stb) és nem kaptak engedély a reprodukcióra perképes állapotba hozza őket. Félre értés ne essék! Király 5letnek tartom ezt az egészet, de kissé gáz, hogy náluk több több száz film/kép/zene és egyéb jogdíjas tartalom elérhető. Ha én (te) csinálnám ezt már régen elsikáltak volna minket.
  • TokraFan #13
    Ugye, ugye? :-D
    Egyébként meglepődnél, sokszor mennyire nincsenek körüljárva ezek a kérdések az üzemeltetők részéről.

    scarabeus86
    A jog -szerencsére-, nem így működik! Csak nézd meg, mennyi szerzői jogi per van és rendre meg is nyerik őket.
  • scarabeus86 #12
    Aki használ internetet, tudnia kéne hogy amit egyszer felrak az ott is maradhat, hiába törli. Ha nem az Archívum, akkor valami rosszakarója menti le a dolgait. Aki ettől fél az ne facezzen, ne töltsön fel semmit, használjon TOR böngészőt és keressen fel egy pszichológust.