Gyurkity Péter

Egybillió egyedi URL az interneten

A Google újabb rekord felállításáról számolt be, ebben ezúttal ők csak megfigyelők - az interneten saját keresőjük immár egybillió egyedi címet indexelt be. Szakértők eközben a feketelisták tökéletesítésén dolgoznak.

A keresőcég beszámolójából kiderül, hogy amikor 1998-ban saját motorjukkal elvégezték az első nagyobb indexelést, összesen 26 millió weboldalt találtak. Az ezredfordulóra ez a szám hihetetlen mértékben megugrott és meg is haladta az egybilliót, mostanra azonban ugyanennyi egyedi URL található a világhálón, ami jól jelzi annak gyors terjedését.

A Google némi magyarázatot is szolgáltat a puszta számok mellett, hogy a laikusoknak is legyen némi elképzelése az összegzés mibenlétéről. Elsőként az előkelő helyen szereplő, sokak által használt és hivatkozott portálokat gyűjtik össze, majd az ezen oldalakon található internetes hivatkozásokat követve jutnak el a kevésbé forgalmas lapokra. Az egybillió egyedi URL azonban nem jelenti pontosan ugyanennyi különálló, teljesen egyedi oldal meglétét, hiszen több portál egyszerre számos címmel is rendelkezik annak érdekében, hogy minél könnyebben megtalálható legyen. A számot az egyértelmű másolatok kiszűrése után kapták meg, hozzátéve, hogy a lapok globális száma eközben igen gyors ütemben növekszik.

Az internet "méretének" meghatározásában természetesen az is szerepet játszik, hogy pontosan mit tartunk hasznos, valóban egyedi, értékes információt közvetítő oldalnak. A hivatkozások követése nem mindig a legjobb megoldás, hiszen például a webes naptárak esetében ez azt jelentené, hogy a következő napra kattintva egy "új" oldalra jutunk, mely a végtelenségig folytatható. Azt a Google munkatársai is megjegyzik, hogy számos oldal redundáns, előre generált tartalommal jelenik meg, ám a pontos számot nem tudják meghatározni, erre nyilván senkinek nincs ideje.

Biztonsági szakértők eközben az internetes feketelisták tökéletesítésén dolgoznak, ez ugyanis a világháló növekedésével egyre fontosabb problémát jelent. Az ezen a héten esedékes 17. Usenix Security Symposium alatt mutatják be a Sans Intézet munkatársai a "highly predictive blacklisting" (HPB) névre keresztelt megoldásukat, amely a helyi és a hálózati adminisztrátorok által frissített feketelisták között helyezkedik el. A fejlesztés azon a megfigyelésen alapul, az egymással kapcsolatban álló hálózatok támadóit általában külön veszik azoktól, amelyek teljesen önálló, egymás számára ismeretlen hálózatokat vesznek célba.

A fejlesztők szerint a megoldással jobban meg tudják becsülni, hogy várható-e újabb támadás, a feketelista maga pedig hatékonyabb és pontosabb a jelenleg használt változatoknál.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • V43 1105 #12
    Milyen ? BluRay DVD egyáltalán?:))
  • trogi #11
    Igen, pont ez a gond. A töketlen angolszászoknak mindig valamiben el kell térniük a normál, vagy ha úgy tetszik a megszokott, elfogadott dolgoktól.

    Szerintem is a long scale a jobb, részletesebb, nem pedig a short scale.
  • endrev #10
    Hülyeséget mondtam. Ha a Mi-llion az 1E6, akkor a Bi-llionnak 1E12-nek kell lennie. Tehát az angolszász a dilettáns, és a magyar forma a helyes.

    Tökjó, hogy így megbeszéltem magammal. Bocsi. :D
  • endrev #9
    Egyébként logikailag az angolszász számelnevezés a helyes, és a magyar szokás a dilettáns, csak meg kell nézni, hogy a bi, tri, quad mit is számol. HAT nullát HÁROM helyett.

    De ezt csak úgy megjegyeztem, lényegében offtopik.
  • Tetsuo #8
    a cikkben is le van irva h nem.
  • metaljesus #7
    nem valószínű. gondolj bele hogy egy-egy oldalnak hány aloldala lehet, itt sg-n is ez 61665-ös cikk, és van ahol ez milliós nagyságrendre rúg. szóval inkább 1000 milliárd egyedi oldalról lehet szó. de pl az xy.fw.hu, abc.fw.hu, stb.fw.hu biztos különbözőnek számítanak.
  • szasz85 #6
    Akkor valóban 1 billió / trillion oldalt indexeltek már.
    Gondolom ezt úgy kell érteni, hogy egy domain és annak aloldalai is beleszámítanak,tehát a yxcvb.hu, yxcvb.hu/asd, yxcvb.hu/qwe az 3 találat.
  • metaljesus #5
    nekem is ez volt az első gondolatom, sg cikkezett már így...
    de aztán megnéztem az eredeti cikket, 1 trillion ;) szóval igen, ezer milliárd oldal, bár kicsit nekem is soknak tűnik :)
    amúgy meg régebben gugliban volt az alján egy kis szöveg, hogy a keresés x weblap között zajlik, és amikor legutóbb láttam ezt évekkel ezelőtt, akkor 8 milliárd körül tartottak :)
  • MrPrise #4
    És mennyi ebből a szemét, semmire sem való oldal...
  • szasz85 #3
    Az inkább 1 milliárd akar lenni nem ? A billió kicsit sok.
    Millióig megegyezik de az annál nagyobb számok elnevezése angolszász területeken máshogy van.

    milliárd = billion = 1E+9
    billió = trillion = 1E+12
    billiárd = quadrillion = 1E+15
    trillió = quintillion = 1E+18
    trilliárd = sextillion = 1E+21