• Commandante
    #12
    Néhány évnyi adatbányászati szakmai tapasztalattal a hátam mögött én a következö módon közelíteném meg a problémát:

    Tfh bombás terroristákra vadászok. Felállítok egy text-mining modellt, ami azonosítja a gyanús beszélgetéseket. Ez lehet pl intuitív (figyeli az adott nyelvet, beszélt dialektust, gyakran elöforduló szavakat min elnök-bomba-dzsihad, stb.) vagy statisztikai alapokon nyugvó (néhány ismert robbantó rögzített beszélgetéseit összehasonlítom ártalmatlan honpolgárok beszélgetéseivel és matematikailag azonosítom a bombatámadásra utaló jegyeket). Minden nap végén az 1. szintü modellel leellenörzöm az adott napi beszélgetéseket, rögzítem a leggyanúsabb 1%-ot, a többit törlöm. A hét végén egy 2. szintü modellel leellenörzöm a héten rögzített beszélgetéseket, megörzöm a leggyanúsabb 1%-ot, a többit törlöm. Hónap végén egy 3. szintü modellel leellenörzöm a hónapban rögzített beszélgetéseket, a leggyanúsabb 1%-ot megörzöm, a maradékot törlöm. Az így kiszürt néhány száz személyt megfigyelés alá helyezem (minden további beszélgetését rögzítem). Új hónap...

    Pl Németországnak 80 millió lakosa van, tfh átlagosan 10 skype beszélgetést folytatnak naponta (lakosonként). Akkor egy hónapban összesen 80*10^6*10*30*10^-6 = 24.000 beszélgetést kell rögzítenem ahhoz, hogy kiszürjem a gyanús egyéneket. A gyanús egyének folyamatos megfigyeléséhez valamivel többet. Ez szerintem gigabyte-os adatmennyiség, tehát nem megoldhatatlan.

    Ahhoz pedig, hogy a titkosított adatfolyamot feltörjék, nem biztos hogy visszafejtik a kódolást (ha ez egyáltalán lehetséges), hanem inkább trójait raknak minden oprendszerbe és kommunikációs programba (a gyártó tudtával vagy a nélkül), és egyszerüen ellopják a titkosításhoz használt kulcsot.

    És amúgy miért kell lépten-nyomon zsidózni, he?