Berta Sándor
A génkutatások a spam elleni harcot is segítik
Az IBM kutatói a génkutatásokban használt mintafelismerési módszert alkalmazzák egy hatékony spamszűrő kifejlesztéséhez. A Chung-Kwei algoritmus képes a tanulásra, és már gyakorlatban is bizonyított.
Az IBM Thomas J. Watson Kutatóközpontjának két kutatónője, Isidore Rigoutsos és Tien Huyn egy úgynevezett Chung-Kwei algoritmust dolgozott ki, amely hatékonyan felismeri a kéretlen elektronikus reklámleveleket. A Chung-Kwei olyan mintafelismerési eljárásokon alapul, amelyeket korábban a génkutatásban alkalmaztak, és előnyei közé tartozik, hogy képes a tanulásra. A rendszer munkája során a Teiresias-algoritmust használja és részét képezi az úgynevezett Spam-Guru rendszernek, amely egy spam-ellenes alkalmazás és amelyet jelenleg is fejleszt az IBM.
Maga az alapötlet rendkívül egyszerű: egy adott mennyiségű spam e-mailben a Teiresias-algoritmus segítségével különböző olyan minták után kutatnak, amelyek többször is előfordulnak egy e-mailben, majd minden újonnan érkező levélben is keresnek az eddigiekkel megegyező mintákat. Minél több a spamekre jellemző minta található végül egy e-mailben, annál nagyobb a valószínűsége, hogy egy spamről van szó.
A kutatók a tesztekhez egy 2,2 GHz-es Pentium 4 processzorral ellátott számítógépet használtak. A rendszert először összesen 87 ezer spam e-maillel terhelték le, majd újabb 88 ezer, vegyesen spam és normál elektronikus leveleket küldtek a tesztgépnek. A rendszer végül a spam e-mailek 96,56 százalékát felismerte és csak 0,066 százaléknyi levélről hitte azt, hogy spam.
A számítógép adatfeldolgozó képességére jellemző, hogy másodpercenként 214 e-mailt vizsgált át és minősített. Az új alkalmazás egyébként főleg a minta-adatbankjában és annak kezelésében különbözik a többi spamszűrő rendszertől. Ennek köszönhető az is, hogy azoknál jobb felismerési aránnyal rendelkezik. Az még kérdéses, hogy a Chung-Kwei mikor debütál a spamszűrőkben.
Az IBM Thomas J. Watson Kutatóközpontjának két kutatónője, Isidore Rigoutsos és Tien Huyn egy úgynevezett Chung-Kwei algoritmust dolgozott ki, amely hatékonyan felismeri a kéretlen elektronikus reklámleveleket. A Chung-Kwei olyan mintafelismerési eljárásokon alapul, amelyeket korábban a génkutatásban alkalmaztak, és előnyei közé tartozik, hogy képes a tanulásra. A rendszer munkája során a Teiresias-algoritmust használja és részét képezi az úgynevezett Spam-Guru rendszernek, amely egy spam-ellenes alkalmazás és amelyet jelenleg is fejleszt az IBM.
Maga az alapötlet rendkívül egyszerű: egy adott mennyiségű spam e-mailben a Teiresias-algoritmus segítségével különböző olyan minták után kutatnak, amelyek többször is előfordulnak egy e-mailben, majd minden újonnan érkező levélben is keresnek az eddigiekkel megegyező mintákat. Minél több a spamekre jellemző minta található végül egy e-mailben, annál nagyobb a valószínűsége, hogy egy spamről van szó.
A kutatók a tesztekhez egy 2,2 GHz-es Pentium 4 processzorral ellátott számítógépet használtak. A rendszert először összesen 87 ezer spam e-maillel terhelték le, majd újabb 88 ezer, vegyesen spam és normál elektronikus leveleket küldtek a tesztgépnek. A rendszer végül a spam e-mailek 96,56 százalékát felismerte és csak 0,066 százaléknyi levélről hitte azt, hogy spam.
A számítógép adatfeldolgozó képességére jellemző, hogy másodpercenként 214 e-mailt vizsgált át és minősített. Az új alkalmazás egyébként főleg a minta-adatbankjában és annak kezelésében különbözik a többi spamszűrő rendszertől. Ennek köszönhető az is, hogy azoknál jobb felismerési aránnyal rendelkezik. Az még kérdéses, hogy a Chung-Kwei mikor debütál a spamszűrőkben.