Berta Sándor

Több millió könyvet digitalizál a British Library

Az Egyesült Kiályság nemzeti könyvtárának épületében, egy ablaktalan, klimatizált helyiségben, nagy gondossággal készül több millió könyv és dokumentum digitális másolata.

A British Library a világ egyik legnagyobb és legismertebb bibliotékája. Látogatói között volt többek között Marx, Lenin és Charles Dickens is. 1911 óta minden Nagy-Britanniában megjelenő könyv egy példányát elküldik a könyvtárnak. Érthető tehát, hogy a szakemberek igyekeznek megőrizni az utókor számára a felbecsülhetetlen értékű műveket. A digitalizálás várhatóan évekig is eltart majd, hiszen a Library állományában jelenleg 13 millió könyv, irat és újság található.

A digitalizálóstúdióban öt szkenner található, ezeket hamarosan további két készülékkel egészítik ki. A munka két műszakban, egyenként hat-hat ember részvételével folyik. A szakembereket a British Libraray számára a Content Conversion Specialists (CCS) nevű hamburgi cég biztosítja. A CCS vállalta, hogy 3 hónap alatt akár egymillió könyvoldalt digitalizál, kitűnő minőségben. Az érv meggyőzte a brit nemzeti könyvtár vezetőit. A programban részt vesz a Microsoft is, amely a 2006 decemberében elindított Live Search Books nevű szolgáltatása keretében teszi közzé - mindenki számára ingyenesen - a már digitalizált anyagokat.

A kutatók célja azonban nemcsak a szkennelés, hanem a művek állapotfelmérése is. A bibliotéka vezetői szeretnék tudni, hogy az egyes könyvek és iratok jelenleg milyen állapotban vannak, milyen hibákat tartalmaznak. A szakemberek először azt vizsgálják meg, hogy az adott dokumentum állapota és a mérete egyáltalán lehetővé teszi-e a digitalizálást. Minden alkalmasnak talált mű egyedi kódot kap, később ennek segítésével lehet kikeresni a könyvtár rendszeréből és így biztosítják azt is, hogy a szkennelési folyamat során egyetlen irat se vesszen el.

Ezután minden esetben először a könyvek bibliográfiai jellemzőit rögzítik, majd két kamera és két, számítógépekkel összekötött szkenner segítségével megtörténik maga a digitalizálás. Az oldalak lapozását robotkar végzi. Végül minden beszkennelt alkotást megvizsgálnak, majd hozzájuk fűzik a könyvtári katalógusban található adatokat. Minden digitális kópia három formátumban elérhető, ezek közül az egyik a JPEG2000, a második a PDF, a harmadik pedig az METS/ALTO-XML változat.

"Mi vagyunk a globalizáció nyertesei" - állította nem véletlenül Richard Helle, a CCS vezetője. A 30 éve alapított hamburgi cégnek jelenleg 260 alkalmazottja van, akik közül sokan az amerikai Kongresszusi Könyvtár vezetésével folyó National Digital Newspaper Programban dolgoznak. A projekt célja az első amerikai újságok megőrzése az utókor számára. A CCS-nek ezenkívül vannak megbízásai Norvégiából, Finnországból, Új-Zélandról, Szingapúrból, sőt a Harvard Egyetemről is.

Érdekesség, hogy nem ez a British Library egyetlen digitalizálási programja, hiszen korábban már megkezdte a weboldalak és a XIX. századi brit újságok archiválását, valamint több bibliotékával közösen részt vesz az 1600 éves, kézzel írt Codex Sinaiticus vagy más néven a Sínai Biblia digitalizálásában is. A szigetország nemzeti könyvtára tavaly pedig úgy döntött, hogy létrehozza az e-mailek archívumát.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • awender #6
    A munka gyorsítható azzal, ha több embert alkalmaznak. A cég folyamatosan új módszereket fejleszt ki a bevitel gyorsítására. Három éve még csak tizedennyit tudtak vállalni.
  • juharfalvi #5
    "3 hónap alatt akár egymillió könyvoldalt digitalizál"

    Ha 1 könyv mondjuk 400 oldalas, akkor 1 millió oldal = 2500 könyv 3 hónap alatt

    1 év alatt ez 10000 könyv.

    Mivel 13 millió könyv van, ezért 13 m / 10000 könyv = 1300 év, ennyi idő alatt végeznek

    Gigantikus vállalkozás. És akkor még a gyarapodással nem is számoltunk...
  • zyppy #4
    majd en beszkennelem
  • Polemius #3
    Valószínűleg nem foglalkoznak magyar könyvekkel, de azok (Arany és Jókai is) megtalálhatók pl. a Magyar Elektronikus Könyvátrban:
  • Axon #2
    Nagyon spéci scanerek lehetnek azok, ha bírják ezt a hatalmas igénybevételt.
    Bár a cik nem fogalmaz egyértelműen, de gondolom csak angol nyelvű könyveket digiznek. Tehát egy magyar nyelvű Jókai vagy Arany nem kerül digitalizálásra.
  • ArcZ #1
    Éljen Dr. Tóvári Judit!