Berta Sándor
A DARPA a "mély webet" is kutatná
Az amerikai katonai kutatóügynökség hasznosítaná azt az ötletet, ami először a második világháború idején bukkant fel.
A Defense Advanced Research Projects Agency (DARPA) a Memex program keretében olyan keresőt akar létrehozni a kormányhivatalok számára, ami képes akár az úgynevezett mély webet is átkutatni információk után. A projekt célja az emberkereskedelem elleni harc. A Google és más keresők ugyan rendkívül fejlettek, de csupán az internet egy kis részét képesek átkutatni a különböző adatok után, ráadásul bármennyire is kiváló kezelőfelülettel rendelkeznek, de nem elég alaposak. A Google nagy vonalakban egy keresés során linkek nyomán vándorol végig az interneten, és az alapján rangsorol előre egy találatot, hogy hány másik honlap hivatkozik rá, de nem indexel duplikált vagy illegális tartalmakat, pornóoldalakat, és az eredményt egy listán kivűl nem rendszerezi egyéb módon. Ezen változtatna a Memex projekt.
A DARPA a projekt meghirdetésekor azt írta, hogy a keresési folyamat többnyire manuális eljárásból áll, továbbá csak egyetlen címszóra vonatkozik és az eredmények nincsenek kategóriákba rendezve. Egy PDF-fájlban az ügynökség azt is kifejtette, hogy a tervezett keresőnek a mély webet is át kell kutatnia, többek között az elrejtett tartalmak után.
A Memex segítségével a DARPA három technikai területen (doménspecifikus indexálás, doménspecifikus keresés és hadügyminisztériumi alkalmazások) szeretne elérni javulást. Az új kereső segítene felderíteni a fórumokban, chateken, reklámokban, álláshirdetésekben, rejtett szolgáltatásokban megbújó információkat, amelyek lehetővé teszik a modern rabszolga-kereskedelmet. A DARPA nem tervezi a névtelenséget biztosító platformok felderítését és nem akar szervereket vagy IP-címeket valódi személyazonosságokhoz rendelni, de kérdés, hogy a célkitűzéseket hogyan valósítaná meg.
A Memex elnevezés egyébként 1945-ből származik és a The Atlantic Monthly újságban megjelent egy cikken alapul, amit Vannevar Bush írt. Ő vezette a második világháborúban az amerikai fegyveres erők kutatási részlegét. Ebben Bush Memexnek nevezte azt a gépet, ami információkat tárolt és azokra automatikusan hivatkozott. A Memex név a Memory és az Index szavak összeolvasztásából született meg.
A Defense Advanced Research Projects Agency (DARPA) a Memex program keretében olyan keresőt akar létrehozni a kormányhivatalok számára, ami képes akár az úgynevezett mély webet is átkutatni információk után. A projekt célja az emberkereskedelem elleni harc. A Google és más keresők ugyan rendkívül fejlettek, de csupán az internet egy kis részét képesek átkutatni a különböző adatok után, ráadásul bármennyire is kiváló kezelőfelülettel rendelkeznek, de nem elég alaposak. A Google nagy vonalakban egy keresés során linkek nyomán vándorol végig az interneten, és az alapján rangsorol előre egy találatot, hogy hány másik honlap hivatkozik rá, de nem indexel duplikált vagy illegális tartalmakat, pornóoldalakat, és az eredményt egy listán kivűl nem rendszerezi egyéb módon. Ezen változtatna a Memex projekt.
A DARPA a projekt meghirdetésekor azt írta, hogy a keresési folyamat többnyire manuális eljárásból áll, továbbá csak egyetlen címszóra vonatkozik és az eredmények nincsenek kategóriákba rendezve. Egy PDF-fájlban az ügynökség azt is kifejtette, hogy a tervezett keresőnek a mély webet is át kell kutatnia, többek között az elrejtett tartalmak után.
A Memex segítségével a DARPA három technikai területen (doménspecifikus indexálás, doménspecifikus keresés és hadügyminisztériumi alkalmazások) szeretne elérni javulást. Az új kereső segítene felderíteni a fórumokban, chateken, reklámokban, álláshirdetésekben, rejtett szolgáltatásokban megbújó információkat, amelyek lehetővé teszik a modern rabszolga-kereskedelmet. A DARPA nem tervezi a névtelenséget biztosító platformok felderítését és nem akar szervereket vagy IP-címeket valódi személyazonosságokhoz rendelni, de kérdés, hogy a célkitűzéseket hogyan valósítaná meg.
A Memex elnevezés egyébként 1945-ből származik és a The Atlantic Monthly újságban megjelent egy cikken alapul, amit Vannevar Bush írt. Ő vezette a második világháborúban az amerikai fegyveres erők kutatási részlegét. Ebben Bush Memexnek nevezte azt a gépet, ami információkat tárolt és azokra automatikusan hivatkozott. A Memex név a Memory és az Index szavak összeolvasztásából született meg.