Berta Sándor

Algoritmusokkal rekonstruálják az átírt szövegeket

A negevi Ben Gurion Egyetem kutatói olyan algoritmusokat fejlesztettek ki, amely segíthetnek a rossz állapotban lévő vagy átírt ókori szövegek rekonstruálásában.

Az informatikusok és humán szakemberek bevonásával indított program célja olyan eljárások kidolgozása volt, amelyeknél számítógépek segítségével olvashatóvá tehetők a sérült, olvashatatlan vagy módosított palimpszesztek. "A palimpszesztek olyan papiruszok, amelyeknél az eredeti írást egy másik szöveggel váltották fel, vagyis átírták" - közölte Klara Kedem, a projektben részt vevő informatikusok egyike.

Az első lépést a héber és az arab nyelvű szövegek megértése jelenti. A cél az, hogy szövegrekonstruáló és - elemző algoritmusok segítségével egy olyan nyílt forráskódú rendszert fejlesszenek ki, amely a későbbiekben felhasználható a történeti dokumentumokkal kapcsolatos kutatásokban és ami elősegítheti ezeket a programokat.


Kedem elmondta, hogy az egyik problémát az átírt papiruszokon lévő eredeti szövegek megtalálása és azok megfejtése jelenti. Ehhez a thresholding nevű képfeldolgozási módszert alkalmazzák, mivel ez meglehetősen pontosnak mondható és a segítségével könnyebben megkülönböztethetők az eredeti és az azt felváltó későbbi betűk. "Ezután az úgynevezett inpainting technikákat használjuk, hogy megkaphassuk a restaurált szövegképet. Ez a módszer gyakorlatilag az összes palimpszeszt esetében működik és fontos megjegyezni, hogy gyakorlatilag bármely írásjel rekonstruálására alkalmas" - tette hozzá az informatikus.

A BGU projektben kifejlesztettek más algoritmusokat is. Ezek egyike a paleográfiai számítógépes elemzésekben segít, lényege a betűformák, a régi dokumentumokban előforduló rövidítések tanulmányozása és megfejtése, ugyanakkor alkalmas az iratok pontos keletkezési időpontjának meghatározására is. A vizsgált anyagok között vannak a kairói Ben Ezra Zsinagóga úgynevezett genizájában talált dokumentumok. A genizákban tárolják a vallásos zsidók a már nem használható, de vallási szabályaik alapján meg nem semmisíthető írásokat, könyveket. A kairói Ben Ezra Zsinagóga genizájában a 19. század végén fedeztek fel 200 000 kéziratot, amelyek némelyike az időszámításunk szerinti 9. századból származik.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • Epikurosz #20
    Distributed Proofreaders:
    beszkennelsz egy könyvet, majd beküldöd lektorálásra. Több lépcsőben, önkéntesek ellenőrzik a szöveget.t, majd a könyv bekerül a Gutenberg projektbe.
    Szerintem a magyar része még nem igazán működik, valszeg kevés az önkéntes.
  • Epikurosz #19
    Épp beszkenneltem elég sok oldalt, és FineReaderrel OCR-eztem. A kilencessel. Ez már butális! Lényegében egyetlen hibát sem ejt a bestia, csak ott téved, ahol a papíron valami folt van, vagy gyűrődött. Pedig a könyv betűkészlete nem most volt papírra vetve, hisz kb. 28 éves könyvről van szó. A sorvégeknél található elválasztójelek kiszedését kellett kézileg megoldanom, de szerintem ezt is be lehet állítani valahol.
  • tommygear #18
    ijjjjj
  • Epikurosz #17
    nem. tudós körökben ezt hívjUk evolúciónak.
  • exac #16
    na ilyen amikor a hülyeség szorgalommal párosul
  • Epikurosz #15
    Na, ilyen lett a szkennerem fedőlapjának belseje:

    (Apropó, ez is felhasználható háttérképként :-)
  • Epikurosz #14
    Van egy rossz, egy jó és egy nagyon jó hírem:

    Nekiestem a szkenner belső fedelén lévő hófehér kartonlapnak, és filctollal sötétkékre festettem (épp nem volt fekete filcem).
    Ilyen lett:

    (Akár háttérképnek is beállíthatod! :-)

    Hülyeség volt, mert macerás, helyette venni kell egy fekete papírlapot, és felragasztani.

    A nagyon jó hírem az, hogy nem kell min. 65k ft-ért dokumentumszkennert venni, mert azoknál a multifunkciós nyomtatóknál, amelyeknél feltüntetik, hogy a szkenner tudja az ADF-et, 20 lapot automatikusan adagol a beolvasó.
  • Sanyix #13
    ben gurion véletlenül nem az egyik legbrutálisabb zsidó terrorista volt aki később elnök lett? :D
  • Epikurosz #12
    A fineReadernek is van szótára.

    Jonah:
    Nekem tényleg nagy a mellényem.
    És igenis ez egy jelentős oldal, mert különben nem jönnél ide. Bummm!
    Itt egyébként a hosszú élet titka meleltt tudomást szerezhetsz az ufókról, a következő magyar kormány politikai összetételéről, a relativitás elmélet mellett a húrelméletről és a villanyautóról is.

    Ha neked ez nem tetszik, lehet menni a zIndex szemétdombjára.
    Én amióta idejárok, a koleszterinszintem csökkent 50 százalékponttal, őszülő hajszálaim visszanyerték serdülőkori színüket, és elmúlt a lábkörömgombám is.
  • Jonah #11
    Már írtam...

    a karakter felismerés viszont más téma mint a feltételvizsgálat. Dehát te okos vagy, biztos ezt is tudod, ha már mindenkit ilyen nagy mellénnyel leosztasz.. én csak erre próbáltalak rávezetni iróniával. De ahogy elnézem, túl komolyra veszed a szereped egy jelentéktelen oldalon.

    üdv.