Kocza Zoltán
Messze még az arab nyelvű Internet
Az elmúlt évtizedben technikusok és nyelvészek egész sora dolgozott azon, hogy az arabok számára idegen latin írás helyett az arab webhelyek arabul jelenjenek meg, de még messze a munka vége.
Mindezidáig a webhelyek nyelve az angol és az általa felhasznált latin karakterek voltak használatosak. A legújabb adalék, a német umlaut is csak a német nyelvben használatos. Szakértők véleménye szerint az internet csak akkor lesz a kommunikáció valódi globális eszköze, ha ez a helyzet megváltozik.
Többnyelvű internetet kétféleképpen lehet létrehozni. Vagy megtanítunk angolul 4,5 milliárd embert szerte a világon, vagy integráljuk a világ nyelveit és nyelvjárásait az internet infrastruktúrájába. Az arab nyelv esetén ez forradalmasítaná az internet közel-keleti felhasználását és gombamód elkezdenének szaporodni az arab webhelyek. Az arab írást négy nagy nyelv használja, és több mint 30 országban ez a hivatalos írásforma. Az internetre átültetéséhez még legalább öt évre lenne szükség, de már így is sok időt elvesztegettek azzal, hogy nem jutottak egyezségre arról, melyik karakter lényeges és a megmaradtakat hogyan lehet leképezni számítógépes kódokkal.
Az Al-Jazeera weblapja - elsőnek a jobbra rendezés tűnhet fel
A dolog bonyolultabb, mint első pillantásra látszik, mert az alapvető karaktereken túl az arab írás opcionális mellékjeleket is használ, amelyek fontosak lehetnek. A qran nevű webhely jelenthet egyrészt házasságot, de magát a Koránt is attól függően, hogy az "a" betű felett van vagy nincs vonal. Tehát problémát jelenthet, ha valaki qran.com címmel nyit egy weboldalt, felrakja a netre házassági tanácsadással foglalkozó anyagait (köztük például a Káma Szutrát), majd ezután egy Koránt olvasni kivánó ember szent szövegek helyett szexuális poziturákat tartalmazó oldalakkal találkozik.
Az arab kormányok és a szakmai szervezetek még mindig nem tudják eldönteni, hogy melyek legyenek a megfelelő arab betűk. Mivel sok szereplő ül a tárgyalóasztalnál, nem tudnak közös szabványban megállapodni, és ráadásul több kereskedelmi vállalkozás a saját rendszerét szeretné érvényesíteni. "22 arab ország van és emellett más népek is (fárszi, urdu, pastu) az arab írást használják ezért éppen ideje, hogy megegyezzenek egymással." - nyilatkozta David Maher, a Public Interest Registry elnöke. "A magánvállalatok saját technológiáikat nyomják, amivel megzavarják az embereket, ezért késik a megegyezés."
Nagyobb probléma a többi ország vonakodása attól, hogy felülvizsgálják az egész Internet címzési rendszerét, hogy a több ezer nem angol karaktert használni tudja. A jelenlegi adatkezelő rendszer az ASCII kódot használja, ami elég kis karakterkészletet jelent. Időleges megoldást jelent a számítógép termináljait úgy beprogramozni, hogy a webhelyek címet a globális internet számára érthetően lefordítsák, ezzel azonban gyakorlati problémák vannak.
Charles Sha'ban, a Multilingual Internet Names Consortium tagja szerint ezek a problémák néhány millió dollár ráfordításával egy éven belül megoldhatók lennének, de a folytatásban közel sem volt enynire optimista: "A valódi megoldás azonban az lenne, ha a karakterek az IETF szabvány szerint közvetlenül bekerülnének az adatfolyamba, ez azonban még öt évet jelentene."
Mindezidáig a webhelyek nyelve az angol és az általa felhasznált latin karakterek voltak használatosak. A legújabb adalék, a német umlaut is csak a német nyelvben használatos. Szakértők véleménye szerint az internet csak akkor lesz a kommunikáció valódi globális eszköze, ha ez a helyzet megváltozik.
Többnyelvű internetet kétféleképpen lehet létrehozni. Vagy megtanítunk angolul 4,5 milliárd embert szerte a világon, vagy integráljuk a világ nyelveit és nyelvjárásait az internet infrastruktúrájába. Az arab nyelv esetén ez forradalmasítaná az internet közel-keleti felhasználását és gombamód elkezdenének szaporodni az arab webhelyek. Az arab írást négy nagy nyelv használja, és több mint 30 országban ez a hivatalos írásforma. Az internetre átültetéséhez még legalább öt évre lenne szükség, de már így is sok időt elvesztegettek azzal, hogy nem jutottak egyezségre arról, melyik karakter lényeges és a megmaradtakat hogyan lehet leképezni számítógépes kódokkal.
Az Al-Jazeera weblapja - elsőnek a jobbra rendezés tűnhet fel
A dolog bonyolultabb, mint első pillantásra látszik, mert az alapvető karaktereken túl az arab írás opcionális mellékjeleket is használ, amelyek fontosak lehetnek. A qran nevű webhely jelenthet egyrészt házasságot, de magát a Koránt is attól függően, hogy az "a" betű felett van vagy nincs vonal. Tehát problémát jelenthet, ha valaki qran.com címmel nyit egy weboldalt, felrakja a netre házassági tanácsadással foglalkozó anyagait (köztük például a Káma Szutrát), majd ezután egy Koránt olvasni kivánó ember szent szövegek helyett szexuális poziturákat tartalmazó oldalakkal találkozik.
Az arab kormányok és a szakmai szervezetek még mindig nem tudják eldönteni, hogy melyek legyenek a megfelelő arab betűk. Mivel sok szereplő ül a tárgyalóasztalnál, nem tudnak közös szabványban megállapodni, és ráadásul több kereskedelmi vállalkozás a saját rendszerét szeretné érvényesíteni. "22 arab ország van és emellett más népek is (fárszi, urdu, pastu) az arab írást használják ezért éppen ideje, hogy megegyezzenek egymással." - nyilatkozta David Maher, a Public Interest Registry elnöke. "A magánvállalatok saját technológiáikat nyomják, amivel megzavarják az embereket, ezért késik a megegyezés."
Nagyobb probléma a többi ország vonakodása attól, hogy felülvizsgálják az egész Internet címzési rendszerét, hogy a több ezer nem angol karaktert használni tudja. A jelenlegi adatkezelő rendszer az ASCII kódot használja, ami elég kis karakterkészletet jelent. Időleges megoldást jelent a számítógép termináljait úgy beprogramozni, hogy a webhelyek címet a globális internet számára érthetően lefordítsák, ezzel azonban gyakorlati problémák vannak.
Charles Sha'ban, a Multilingual Internet Names Consortium tagja szerint ezek a problémák néhány millió dollár ráfordításával egy éven belül megoldhatók lennének, de a folytatásban közel sem volt enynire optimista: "A valódi megoldás azonban az lenne, ha a karakterek az IETF szabvány szerint közvetlenül bekerülnének az adatfolyamba, ez azonban még öt évet jelentene."