Berta Sándor
Algoritmusokkal rekonstruálják az átírt szövegeket
A negevi Ben Gurion Egyetem kutatói olyan algoritmusokat fejlesztettek ki, amely segíthetnek a rossz állapotban lévő vagy átírt ókori szövegek rekonstruálásában.
Az informatikusok és humán szakemberek bevonásával indított program célja olyan eljárások kidolgozása volt, amelyeknél számítógépek segítségével olvashatóvá tehetők a sérült, olvashatatlan vagy módosított palimpszesztek. "A palimpszesztek olyan papiruszok, amelyeknél az eredeti írást egy másik szöveggel váltották fel, vagyis átírták" - közölte Klara Kedem, a projektben részt vevő informatikusok egyike.
Az első lépést a héber és az arab nyelvű szövegek megértése jelenti. A cél az, hogy szövegrekonstruáló és - elemző algoritmusok segítségével egy olyan nyílt forráskódú rendszert fejlesszenek ki, amely a későbbiekben felhasználható a történeti dokumentumokkal kapcsolatos kutatásokban és ami elősegítheti ezeket a programokat.
Kedem elmondta, hogy az egyik problémát az átírt papiruszokon lévő eredeti szövegek megtalálása és azok megfejtése jelenti. Ehhez a thresholding nevű képfeldolgozási módszert alkalmazzák, mivel ez meglehetősen pontosnak mondható és a segítségével könnyebben megkülönböztethetők az eredeti és az azt felváltó későbbi betűk. "Ezután az úgynevezett inpainting technikákat használjuk, hogy megkaphassuk a restaurált szövegképet. Ez a módszer gyakorlatilag az összes palimpszeszt esetében működik és fontos megjegyezni, hogy gyakorlatilag bármely írásjel rekonstruálására alkalmas" - tette hozzá az informatikus.
A BGU projektben kifejlesztettek más algoritmusokat is. Ezek egyike a paleográfiai számítógépes elemzésekben segít, lényege a betűformák, a régi dokumentumokban előforduló rövidítések tanulmányozása és megfejtése, ugyanakkor alkalmas az iratok pontos keletkezési időpontjának meghatározására is. A vizsgált anyagok között vannak a kairói Ben Ezra Zsinagóga úgynevezett genizájában talált dokumentumok. A genizákban tárolják a vallásos zsidók a már nem használható, de vallási szabályaik alapján meg nem semmisíthető írásokat, könyveket. A kairói Ben Ezra Zsinagóga genizájában a 19. század végén fedeztek fel 200 000 kéziratot, amelyek némelyike az időszámításunk szerinti 9. századból származik.
Az informatikusok és humán szakemberek bevonásával indított program célja olyan eljárások kidolgozása volt, amelyeknél számítógépek segítségével olvashatóvá tehetők a sérült, olvashatatlan vagy módosított palimpszesztek. "A palimpszesztek olyan papiruszok, amelyeknél az eredeti írást egy másik szöveggel váltották fel, vagyis átírták" - közölte Klara Kedem, a projektben részt vevő informatikusok egyike.
Az első lépést a héber és az arab nyelvű szövegek megértése jelenti. A cél az, hogy szövegrekonstruáló és - elemző algoritmusok segítségével egy olyan nyílt forráskódú rendszert fejlesszenek ki, amely a későbbiekben felhasználható a történeti dokumentumokkal kapcsolatos kutatásokban és ami elősegítheti ezeket a programokat.
Kedem elmondta, hogy az egyik problémát az átírt papiruszokon lévő eredeti szövegek megtalálása és azok megfejtése jelenti. Ehhez a thresholding nevű képfeldolgozási módszert alkalmazzák, mivel ez meglehetősen pontosnak mondható és a segítségével könnyebben megkülönböztethetők az eredeti és az azt felváltó későbbi betűk. "Ezután az úgynevezett inpainting technikákat használjuk, hogy megkaphassuk a restaurált szövegképet. Ez a módszer gyakorlatilag az összes palimpszeszt esetében működik és fontos megjegyezni, hogy gyakorlatilag bármely írásjel rekonstruálására alkalmas" - tette hozzá az informatikus.
A BGU projektben kifejlesztettek más algoritmusokat is. Ezek egyike a paleográfiai számítógépes elemzésekben segít, lényege a betűformák, a régi dokumentumokban előforduló rövidítések tanulmányozása és megfejtése, ugyanakkor alkalmas az iratok pontos keletkezési időpontjának meghatározására is. A vizsgált anyagok között vannak a kairói Ben Ezra Zsinagóga úgynevezett genizájában talált dokumentumok. A genizákban tárolják a vallásos zsidók a már nem használható, de vallási szabályaik alapján meg nem semmisíthető írásokat, könyveket. A kairói Ben Ezra Zsinagóga genizájában a 19. század végén fedeztek fel 200 000 kéziratot, amelyek némelyike az időszámításunk szerinti 9. századból származik.