Berta Sándor

BMW csalás a Google-ban

Sok cég szinte bármire hajlandó azért, hogy az online keresési listák élén "landoljon". A vállalatok akár még arra is képesek, hogy megpróbálják manipulálni a keresőket. A BMW is megpróbálkozott ezzel de felsült, és a Google most eltávolította a keresési indexből a konszern néhány weboldalának a linkjét.

A webfejlesztők megpróbálták a vállalat német weboldalát, a BMW.de lapot a cég előnyére módosítani, illetve manipulálni. Erre válaszul a vállalat eltávolította a bejegyzések többségét - írta internetes naplójában Matt Cutts, a Google szoftvermérnöke. Jelenleg az autógyártóra rákeresve csupán a nemzetközi BMW.com-ot találhatjuk meg, a német főlap eltűnt.

Szakértők szerint számos módon lehet manipulálni egy online keresőt. Mivel a Google a keresési eredményeket aszerint rangsorolja, hogy melyik oldalra hányan hivatkoznak, illetve hányszor fordul elő a keresett szó vagy fogalom, így a BMW szakembereinek viszonylag könnyű dolguk volt. Más oldalt jelenítetek meg a keresőt indexelő robotoknak és a sima felhasználóknak, így a Neuwagen (új kocsi) szót beütve a BMW.de portálon lévő link került előre. Hasonló indokok miatt távolították el a keresési indexből az automobile.de oldal linkjét is. A BMW németországi oldalát csak azután fogják újra felvenni a keresési indexbe ha a társaság vállalja, hogy többet nem tesz kísérli meg a Google manipulálását.

Az eset azért keltett nagy visszhangot világszerte és számít precedensértékűnek, mert ez az első alkalom, amikor egy internetes keresőcég egy nagyvállalattal szemben alkalmazza a keresési indexből való kitiltás módszerét. A Google nem számít "szívbajosnak", hiszen néhány héttel ezelőtt a Ricoh németországi oldalával szemben járt el ugyanígy. A vád ott is a keresési eredmények befolyásolása volt.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • h4x0r #26
    Okes, nem a Flash-t szidtam, nincs is vele bajom, de vedd figyelembe, hogy a Flash megis binaris formatum. Ha csak szimpla szoveg van egy-ket keppel, akkor minek Flash? Olyan, mintha 100 meteren autoval kozlekednel, amikor gyalog konnyebb es kenyelmesebb. A html a Flash-hez kepest sokkal konnyebben indexelheto, egy keresett oldal hamarabb elerheto, testreszabhatobb, stb.
    A fejlodeshez annyit, hogy a HTML-nek nem fejlodnie, hanem szabvanyosodnia kell. A Flash, Java, stb. feladata pont az webes alkalmazasoknal, hogy megoldja amit nem lehet szimpla szoveg+kep komboval. Mivel az alkalmazas. A HTML dokumentum.
    Es nem mondanam, hogy a Google rossz. Csak gondol a tobbi platformra is (pl. beagyazott rendszerek, mobil eszkozok, stb.), amik nem biztos, hogy tudjak kezelni a Flash/Java/ActiveX/... cuccokat.

    "ezért pl a google szabályzata szerint azonnali kizárás jár."

    Tudom, pont errol volt szo. Marmint a BMW-nel :)
  • Komolytalan #25
    A gond ott van, hogy a google köcsögölése miatt megint kaptak a flash siteok egy támadási felületet (nem találja meg a google). Ha megnézed, a böngészőháború miatt a html szabvány olyan tetves lassan fejlődik, mint egy rinocérosz. Ezzel szemben a Flashnek 2000-ben jelent meg az 5-ös változata, amiben már megfelelő megszállottsággal rendelkezők akár komplex dolgokat is készíthettek, 2004 elején meg már megvolt a Flash 7, ami egy az egyben alkalmazás feljesztő eszköz. 2 évente annyit lépnek előre, mint a html 10 év alatt, és már régesrég megelőzték technológiában a html oldalakat. Csak google egyelőre nem tudja mit akar a flashhel, hogy csinál saját flash szerű google plugint (valószínű), vagy csak szimplán kipusztítja. Így egyelőre szabotálja azokat a próbálkozásokat, amely piacon ő nincs jelen.
    Lehet csinálni olyan flash oldalt, ami nem csicsás, arra van optimalizálva hogy minél nagyobb felületen szöveget olvashass rajta. Lehet kimásolhatóvá tenni az adott szöveget, meg hát ugye ha már xml adatformátumot használ a flash is, akkor pite csinálni hozzá egy nyomtatási képet. Ugyanakkor lehet pl 360 fokos képpel bemutatni benne egy eladandó lakást, vagy autót. Meg mondjuk 1 fotógalériánál egyátalán nem mind1, hogy mennyire intelligensen puffereli elő a képeket. Ok, htmlel is lehet ilyet csinálni, csak a böngészőbeállítások 1%-án fog működni.
    Skypeot szerintem ne hozzuk elő, amikor a google pont a napokban lépett be a skype piacára, mert hát az egész világ legyen google. Már rosszabb mint az M$.
    "A konfigban a *.googlebot.com címről érkező kéréseket az egyik virtuális hoszt kezeli le, a többit pedig egy másik." - ezért pl a google szabályzata szerint azonnali kizárás jár. Ha bármi módon meg próbálod állapítani, hogy google robot nézi az oldalad, akkor kivesznek a találati listából.
  • h4x0r #24
    Örülök a vitának. :)
    Szóval: a html-t és a http protokolt eleve nem interaktív kapcsolatra találták ki, arra pont ott vannak a Java, Flash, stb. cuccok. Ezt nem is tagadtam. De a html nagyon jó, ha pusztán azt akarod megmondani, hogy a XY koncert ekkor meg ekkor lesz, hogy egy adott program dokumentációja itt van, stb. A Flash és Java a weben, mint kliens-alkalmazások csak másodlagos szerepűek általában. Nem fikázom, de még mindíg az írott szöveg a legkönnyebben feldolgozható az ember számára. Gondolj csak pl. a Skype egyszerű, intuitív oldalára.
    Ergonómia pedig nem új tudomány, és nem is hülyeség. Pl. ha az oldaladon a színek nem harmonizálnak, akkor nehéz lesz olvasni, így a kutyát sem fogja érdekelni. De nem csak weben van, valamint nem csak kényelmi, hanem orvosi szempontok is vannak. Ugye nem mindegy, hogy egy széken ha 2-3 órát ülsz, akkor mennyire fáj mondjuk a derekad. Bár lehet, hogy túloznak.

    "Keressél rá google-val, hogy google ranking, vagy google indexing, és olvasgass."

    Azért kérdeztem, mert nekem bizony szokott Flasht is tartalmazó oldalakat adni bőven.

    "Hmm, és szerinted ez hogy működne pontosan?"

    A konfigban a *.googlebot.com címről érkező kéréseket az egyik virtuális hoszt kezeli le, a többit pedig egy másik. Ugyanaz a www.almaarus.hu cím lesz kliens szempontjából mindkettő.

    "Ja, hogy ezt kizárással bünteti a google, mint a BMWnél? Bocsi..."

    Valszeg másból jöttek rá (pl. valaki észrevette a cache-elt és valódi változat közti különbséget).

    "Ez nem hit kérdés, keress rá az ott szereplő szavakra, és meglátod az eredményt."

    Nem tudom, az én oldalamat szinte csak a meta alapján lehet megtalálni.

    "Mármint ha érdekel ennyire a dolog."

    Utána is fogok nézni pontosan.

    "Ez az elmélet, próbáld ki a gyakorlatban a dolgot. A metatag sokkal alacsonyabb google indexet kap, mint a title tagban szereplő szavak."

    Próbáltam. Bár nekem pusztán szöveges az oldalam, minimális mennyiségű képpel.
  • Komolytalan #23
    "...semmi sem. Nem csak a Google. Ezert kene a Flasht elfelejteni informaciotarolas szempontjabol."
    Nem csak nem indexeli, de esélyt se ad arra, hogy indexelhetővé tegyél egy flashes oldalt, mert tiltja a rejtett linkeket. Ez kb olyan, mintha azt mondanám, hogy nehéz ellenőrizni azt, hogy ki szúr le kicsodát, ezért úgy általában betiltom a kés, és egyéb éles-hegyes eszközök használatát. Mert így kényelmesebb, mert megtehetem.
    Egyébként meg ok, felejtsük el a flasht információtárolás szempontjából. Meg úgy általában a flasht is, a java-t is, mindent ami nem szabvány (valid, lol, mi valid?) html. Ezzel semmi mást nem dobunk ki az ablakon, csak azt, hogy böngészőben újratöltődés nélkül reagáló, kétirányú kommunikációra képes, rich média tartalmat korrektül kezelő alkalmazásaink legyenek. Jó, persze, a html-t is meg lehet annyira tuningolni, hogy erre képes legyen, meg sz.rrá lehet javascripttel tömni, amit google szintén index levonással büntet, de most ezt ne nézzük. Nem is kell hozzá csak 5 év, és böngésző is készül, ami majd tudja a tuningokat. Meg persze lesz aki a böngészőt pontosan olyan beállítások mellett használja, hogy az adott oldal működni is fog. Meg persze a böngészők totál kompatíbilisek lesznek az előző verziókkal, mint ahogy eddig is azok voltak. Meg majd esik piros hó is. IE7 CSS se fogja teljes mértékben supportálni. Lehet még marsraszállás előtt megérjük, hogy html alapú oldalak megközelítik azt lehetőségben, amit a flash/java már évek óta tud.
    Az a helyzet, hogy jelenleg flash/java az, amivel rendes PCs alkamazásokhoz hasonló weboldalakat lehet csinálni. Itt most olyanra gondolok mint a Webes ICQ, vagy pl a http://www.collab.nl/ (expand chat panel, és utána video meg rajzolós chat, leginkább távmunkásoknak használhatnák, ez egy demo site). De lehetne még sorolni 1000 dolgot amit htmlel nem csinálsz meg, flashhel/javaval meg igen, és nem banner vagy játék, hanem alkalmazás, vagy olyan oldalfunkció, ami a látogatók számára hasznos lehet. Most pl ha ilyesmi kell egy multinak, akkor egyátalán nem mind1, hogy azt kéred-e, hogy telepítsük fel XY programot, ami ki tudja mivel veszik össze, vagy telepítsünk fel egy flash plugint (ami lehet már fent is van). De a google nem fog rátalálni, mert ugye google kimondta hogy nem költünk a keresőrobot fejlesztésére, jó az ami már 10 éve gyűjti az információkat, inkább az adatbázis optimalizálásra kell a zsé, meg csináljunk google earth-öt, mert az olyan vicces.

    "Ezt mibol gondolod?"
    Keressél rá google-val, hogy google ranking, vagy google indexing, és olvasgass.
    "Nem gondolod, hogy egyszerubb egy Virtual Hostot letrehozni erre a celra? Pl. Apache eseten ez egy-ket sor."
    Hmm, és szerinted ez hogy működne pontosan? Van egy www.almaarus.hu címem, és csinálok egy google.almaarus.hu aldomaint, ami csak google-nak készült? Nyeljük le, hogy aldomain vagy belső oldal szintén alacsonyabb google indexet kap mint egy domain nyitó oldala. Viszont ha ezt találja meg a google robot, akkor erre fog a google találat is ugrani. A látogató meg lát egy nagy büdös text oldalt, vagy pedig olyanra csinálod meg, hogy text ne látszódjon, és automatikusan továbbugorjon a megfelelő szép oldalra. Ja, hogy ezt kizárással bünteti a google, mint a BMWnél? Bocsi...
    "Vagy szimplan csak informativak akarnak lenni. Bar nem hinnem, hogy erre tobb pontot kapsz."
    Ez nem hit kérdés, keress rá az ott szereplő szavakra, és meglátod az eredményt. Mármint ha érdekel ennyire a dolog.
    "Metatagkent sokkal relevansabb a dolog, az adja meg a tipikus keresoszokat."
    Ez az elmélet, próbáld ki a gyakorlatban a dolgot. A metatag sokkal alacsonyabb google indexet kap, mint a title tagban szereplő szavak.
  • Komolytalan #22
    1. És azzal, hogy tiltják a rejtett linkek használatát, esélyt se adnak rá, hogy indexelve legyen a flashes oldal.
    2. Jelenleg igen sokan kikapcsolják a képek megjelenítését. Lehet hogy a következő böngészőkben benne se lesz. Azzal meg ne gyere, hogy hűde sokan használnak lynxet, mert kb senki se használ.
    3. Web-ergonómus - eszem f.szom megáll tényleg, milyen szakmát találnak még ki az ingyenélők maguknak? Frameset lehet hogy elavult, de van amikor nem lehet megkerülni, csak ezt a web-ergonómusok nem tudják. Nem poénból bonyolítja senki se az életét, hanem mert muszáj. Pl. flashes, javas, akármis oldalnál, ami nem tölti újra kattintásra az oldal teljes tartalmát a korrekt auditálást a webaudit és egyéb cégek szerint úgy kell megoldani, hogy egy 1 pixeles framebe teszed az audit kódot tartalmazó mini html-t, és ezt töltögeted újra kézzel. Mert ugye aki fél napot egy adott oldalon tölt az ne 1 db látogatásnak számítson már. Ezt táblázattal (div) nem tudod megoldani, csak framesettel.
    XML meg egy adattárolási szabvány, ami a html kiterjesztéseként jött létre (vagyis a html egy spec xml), semmi több. Static xml-el nem, de dinamikus xml-el már leírható egy oldal szerkezete, ami _elvileg_ egyszerű cserékkel htmlé alakítható (ehhez kell az xslt fájl). A realitás meg az, hogy mivel az xml nem statikus, hanem kódból generált, így a hibák száma nem csökkent, csak más jellegűek lettek (nem 1 lezáró tagot felejt ki az ember, hanem 5-öt egyszerre, mást is cserél mint amit az ember gondol, stb). Az ellenőrzési idő se kevesebb jelentősen, ugyanúgy végig kell próbálgatni fekete doboz módszerrel a siteot, az xml semmire se ad garanciát (mivel dinamikus, kódból generált). Mondjuk ettől még az xml jó dolog, mert azért megkönnyíti az életet, csak a szilanizálás része kamu (nem világmegváltó). Meg máshol - pl flashben - ez a kód/adat elkülönülés már sokkal régebben, és sokkal korrektebbül megtörtént.
  • h4x0r #21
    "Flasht abszolúte nem indexel"

    ...semmi sem. Nem csak a Google. Ezert kene a Flasht elfelejteni informaciotarolas szempontjabol.

    "A google _bevallottan_ magasabb indexeket ad azoknak az oldalaknak, ahol a tartalom szöveg, a formázókódok meg minimálisak"

    Ezt mibol gondolod?

    "Csinálsz 1 oldalt, arra raksz 1 linket, ami egy "google komptatíbilis" oldalra visz, meg egy javascriptet (vagy flash detectort, tökmind1), ami tovább ugrik automatice a valós oldalra."

    Nem gondolod, hogy egyszerubb egy Virtual Hostot letrehozni erre a celra? Pl. Apache eseten ez egy-ket sor.

    "Amúgy csendesen jegyzem meg, hogy bizonyos oldalak nem véletlenül írják bele a fél lorettói litániát az oldal címkéjébe, hanem azért, mert a google - a domain név után - az itt talált szavakra ad legmagasabb indexet."

    Vagy szimplan csak informativak akarnak lenni. Bar nem hinnem, hogy erre tobb pontot kapsz. Ez inkabb a talalat megjelenitesenel lehet segitseg. De ha nem relevans, akkor szarni fog erre a kedves bongeszo kozonseg... Szal nem hiszem, hogy megeri.

    "Ha beleírsz 50 szót - pl jojatek.hu - akkor mindre meg fog találni, sokkal inkább mintha az oldalon belül bárhová (metatag, valódi szöveg, akármi) írod az adott szót. Ez is a baromi intelligens google indexing része."

    Metatagkent sokkal relevansabb a dolog, az adja meg a tipikus keresoszokat.
  • Dj Faustus #20
    1. Sem a Flash-t, sem a képeket, sem a hangokat nem lesz képes indexelni egyik kereső sem, amig nem lesz megfelelő beszéd->szöveg/kép->szöveg/zenei hang->midi konverzió (és a hozzá megfelelő számítási teljesítmény).
    2. Az alt attribútum (nem tag!) nemcsak a keresők számára fontos. Fontos az akadálymentesítés során, fontos azoknak a felhasználóknak akik kikapcsolják a képek megjelenítését/szöveges böngészőt használnak.
    3. Frameset... Elavult, web-ergonómusok által ellenjavalt technika. Jelenleg <div> elemekkel felépített, CSS-el formázott oldalak a "trendik" a jövő talán az XML-en alapuló megoldásoké (tartalom/forma/struktúra szétválaszása).
  • Komolytalan #19
    Amúgy csendesen jegyzem meg, hogy bizonyos oldalak nem véletlenül írják bele a fél lorettói litániát az oldal címkéjébe, hanem azért, mert a google - a domain név után - az itt talált szavakra ad legmagasabb indexet. Ha beleírsz 50 szót - pl jojatek.hu - akkor mindre meg fog találni, sokkal inkább mintha az oldalon belül bárhová (metatag, valódi szöveg, akármi) írod az adott szót. Ez is a baromi intelligens google indexing része.
  • Komolytalan #18
    Nem teljesen így működik a dolog. Csinálsz 1 oldalt, arra raksz 1 linket, ami egy "google komptatíbilis" oldalra visz, meg egy javascriptet (vagy flash detectort, tökmind1), ami tovább ugrik automatice a valós oldalra. Google robot nem kezel javascriptet, ezért ő a számára fenntartott oldalra ment el, míg a látogatók a normálisra. Más kérdés hogy ha nem automatikus ugrást használnak, hanem felraknak két gombot a nyitóoldalra, hogy belépés, meg szöveges változat a google és lynx használók számára, akkor már elég nehezen támadható lenne a dolog.
    Az meg a BMW szemétsége, hogy a google komptatíbilis oldalon nem a valós oldal tartalmát jelenítette meg, a google robotnak is emészthető formátumban (gyakorlatilag plain text, max linkekkel), hanem beírta 1000x hogy újautó németül.
  • Komolytalan #17
    Na persze, ez a duma része. A valóság meg az, hogy beleraksz 1 framesetet, aztán osztódik 2-vel a google indexed. Ha egy flasht is, akkor meg szorzódik -1-el, hogy még véletlenül se találja meg a google.
    A google _bevallottan_ magasabb indexeket ad azoknak az oldalaknak, ahol a tartalom szöveg, a formázókódok meg minimálisak. Olvasd el ők maguk mit írnak ebben a témában.
    Flasht abszolúte nem indexel, csak azt a trágyát, amit a flash publish része kigenerál és commentként belerak a html-be, amibe a flasht ágyazod. Mondjuk ad rá 1/1000-ed akkora értéket, mintha egy sima, tök üres html oldalra beírnád ugyanazt a szót. Ráadásul ez csak static szöveg, dinamikusan beolvasott tartalomra rá se bagózik, sőt tiltott az is, hogy rejtett linkkel rávezesd a bénáját.