Berta Sándor
Felismerhetők a hazugságok egy e-mailben
Vajon kideríthető-e, hogy egy szöveg megfogalmazója mikor téveszti meg a címzettet?
Stephan Ludwig, a Surrey Egyetem docense és Tom Van Laer, a Londoni City Egyetem Cass Üzleti Iskolájának marketingprofesszora egy újonnan kifejlesztett algoritmus segítségével több ezer e-mailt vizsgált meg és arra volt kíváncsi, hogy azok tartalma mennyire valós. A két kutató a nyelvi mintákat vette górcső alá. Mint kiderült, az, aki hazudik vagy erősen elferdíti az igazságot, írás közben akaratlanul is bizonyos szabályokhoz tartja magát.
Ludwig kiemelte: a legjobb úton haladnak afelé, hogy kiszámítsák azt, hogy egy szöveg megfogalmazója igazat írt-e vagy sem. Az algoritmusuk már most nagyon sok jelet képes azonosítani, amelyek rendkívül nagy valószínűséggel képesek rámutatni egy csalásra. Van Laer hozzátette, hogy alapvetően három különböző kommunikációs szintet vizsgálnak. Az elsőnél a szavak szintjén kutatnak. Ilyenkor az algoritmus azt nézi, hogy valaki milyen szavakat alkalmaz és mennyire tér el e szócsoportok normális használatától. A második szint az, hogy valaki miként építi fel a szövegét, míg a harmadik a stilisztika. Többek között azt is szemügyre veszik, hogy a szöveget író közvetlenül megszólítja-e a címzettet vagy sem.
Ludwig példaként említette, hogy a hazudozók kevesebb személyes névmást alkalmaznak és feltűnően gyakran egészítik ki a szövegeiket melléknevekkel. Ritkán írnak egyes és második személyben, de a címzett megszólításakor sokkal gyakrabban használnak olyan szavakat, mint a "keresni" vagy a "kiváló". Aki hazudik, az megpróbálja a szövegeit sokkal jobban megfogalmazni és az elektronikus levelek elemzésekor sokkal tudatosabban alkalmaz olyan szavakat, mint a "mert", az "így", a "ha", a "miért" és a "bár".
Nem kell hozzá hazugságvizsgáló
Aki valamit csak kitalál az nem igazán spontán módon ír. Azt ugyanis, amit leírt, a valóságban sosem élte vagy érezte át, így nincsenek azzal kapcsolatos emlékei sem. A hazug emberek megkísérlik minél nehezebbé tenni a lebuktatásukat, ezért nagy mértékben alkalmazkodnak a másik személy beszéd- és kommunikációs szokásaihoz. A két fél ráadásul folyamatosan idomul egymáshoz; minél intenzívebb és hosszabb egy e-mailes kommunikáció, annál nagyobb fokú ez az alkalmazkodás. Ez megfigyelhető mind a hasonló szavak és kifejezések alkalmazásában, mind a kommunikációs stílus tekintetében.
Nagyon finom különbségekről van szó, és a rendszert még meg kell tanítani arra, hogy vannak regionális eltérések az írott nyelvben. Vannak olyan személyek, akik második vagy harmadik személyben írnak magukról és az idegen nyelv használata is nehezítés lehet, mert ilyenkor mindenki más szavakat vagy szófordulatokat alkalmaz, mint az anyanyelv használata esetén. A szövegkörnyezet megértésében az algoritmus még gyerekcipőben jár, ennek ellenére a mindennapi e-mailek esetében már nagyon szép eredményeket értek el.
Van Laer hangsúlyozta, hogy a nagyon jól képzett rendőrök 54 százalékos valószínűséggel képesek felismerni, hogy a velük szemben lévő személy hazudik-e vagy sem. Ez azonban csak mindössze 4 százalékkal jobb arány a tisztán véletlenen alapuló döntéseknél. Az írott anyagok esetében ugyanakkor sokkal nehezebben szűrik ki a felhasználók a hazugságokat. Az ő algoritmusok viszont 60,02 százalékos pontossággal képes erre, annak ellenére, hogy csak a használt szavakat veszi figyelembe, a környezetet és a szerző pszichogrammáját nem. Az algoritmus nincsen tapasztalatokkal sem felvértezve. Amennyiben még az egyes személyekkel kapcsolatos háttérinformációkkal (a szöveget író neme, élettapasztalata, a közte és a címzett közötti kapcsolat stb.) is kiegészítik a rendszert, akkor elérhető a 70 százalékos felderítési arány.
Ludwig leszögezte, hogy az algoritmust alkalmazni lehetne akár a reklámok igazságtartalmának megvizsgálására és a cégek esetében a beszállítói ajánlatok ellenőrzésére. Nem szabad azt sem elfelejteni, hogy egy nagyon kényes területről van szó. Tanulmányok szerint átlagosan naponta több mint 200 valótlansággal szembesülünk, de ezek többsége egyáltalán nem rossz szándékú dolog, hanem csak egy bók vagy egy kis füllentés. De ha a hazugság már az emberi természet szerves része, akkor megpróbálhatnánk legalább egy kicsit jobban megérteni, hogy egyáltalán miért vezetjük meg egymást és mik ennek a jelei.
Van Laert érdekelné, hogy egyáltalán mi visz rá valakit arra, hogy hazudjon. De kutatni kellene azt is, hogy miért esik bele valaki egy hazug ember csapdájába és mit lehet tenni a megtévesztési manőverek átlátására. Korábban angol, német, svájci, bolgár, spanyol és kenyai szakemberek a Pheme európai uniós projekt keretében arra a kérdésre keresték a választ, hogy mennyire megbízhatóak a közösségi médián keresztül terjesztett információk. A tudósok a helyes információknak a hazugságoktól és félrevezető adatoktól való megkülönböztetésére többek között nyelvészeti és grafikus módszereket alkalmaztak, s azokat ötvözték a Big Data-elemzésekhez használt technológiákkal.
Stephan Ludwig, a Surrey Egyetem docense és Tom Van Laer, a Londoni City Egyetem Cass Üzleti Iskolájának marketingprofesszora egy újonnan kifejlesztett algoritmus segítségével több ezer e-mailt vizsgált meg és arra volt kíváncsi, hogy azok tartalma mennyire valós. A két kutató a nyelvi mintákat vette górcső alá. Mint kiderült, az, aki hazudik vagy erősen elferdíti az igazságot, írás közben akaratlanul is bizonyos szabályokhoz tartja magát.
Ludwig kiemelte: a legjobb úton haladnak afelé, hogy kiszámítsák azt, hogy egy szöveg megfogalmazója igazat írt-e vagy sem. Az algoritmusuk már most nagyon sok jelet képes azonosítani, amelyek rendkívül nagy valószínűséggel képesek rámutatni egy csalásra. Van Laer hozzátette, hogy alapvetően három különböző kommunikációs szintet vizsgálnak. Az elsőnél a szavak szintjén kutatnak. Ilyenkor az algoritmus azt nézi, hogy valaki milyen szavakat alkalmaz és mennyire tér el e szócsoportok normális használatától. A második szint az, hogy valaki miként építi fel a szövegét, míg a harmadik a stilisztika. Többek között azt is szemügyre veszik, hogy a szöveget író közvetlenül megszólítja-e a címzettet vagy sem.
Ludwig példaként említette, hogy a hazudozók kevesebb személyes névmást alkalmaznak és feltűnően gyakran egészítik ki a szövegeiket melléknevekkel. Ritkán írnak egyes és második személyben, de a címzett megszólításakor sokkal gyakrabban használnak olyan szavakat, mint a "keresni" vagy a "kiváló". Aki hazudik, az megpróbálja a szövegeit sokkal jobban megfogalmazni és az elektronikus levelek elemzésekor sokkal tudatosabban alkalmaz olyan szavakat, mint a "mert", az "így", a "ha", a "miért" és a "bár".
Nem kell hozzá hazugságvizsgáló
Aki valamit csak kitalál az nem igazán spontán módon ír. Azt ugyanis, amit leírt, a valóságban sosem élte vagy érezte át, így nincsenek azzal kapcsolatos emlékei sem. A hazug emberek megkísérlik minél nehezebbé tenni a lebuktatásukat, ezért nagy mértékben alkalmazkodnak a másik személy beszéd- és kommunikációs szokásaihoz. A két fél ráadásul folyamatosan idomul egymáshoz; minél intenzívebb és hosszabb egy e-mailes kommunikáció, annál nagyobb fokú ez az alkalmazkodás. Ez megfigyelhető mind a hasonló szavak és kifejezések alkalmazásában, mind a kommunikációs stílus tekintetében.
Nagyon finom különbségekről van szó, és a rendszert még meg kell tanítani arra, hogy vannak regionális eltérések az írott nyelvben. Vannak olyan személyek, akik második vagy harmadik személyben írnak magukról és az idegen nyelv használata is nehezítés lehet, mert ilyenkor mindenki más szavakat vagy szófordulatokat alkalmaz, mint az anyanyelv használata esetén. A szövegkörnyezet megértésében az algoritmus még gyerekcipőben jár, ennek ellenére a mindennapi e-mailek esetében már nagyon szép eredményeket értek el.
Van Laer hangsúlyozta, hogy a nagyon jól képzett rendőrök 54 százalékos valószínűséggel képesek felismerni, hogy a velük szemben lévő személy hazudik-e vagy sem. Ez azonban csak mindössze 4 százalékkal jobb arány a tisztán véletlenen alapuló döntéseknél. Az írott anyagok esetében ugyanakkor sokkal nehezebben szűrik ki a felhasználók a hazugságokat. Az ő algoritmusok viszont 60,02 százalékos pontossággal képes erre, annak ellenére, hogy csak a használt szavakat veszi figyelembe, a környezetet és a szerző pszichogrammáját nem. Az algoritmus nincsen tapasztalatokkal sem felvértezve. Amennyiben még az egyes személyekkel kapcsolatos háttérinformációkkal (a szöveget író neme, élettapasztalata, a közte és a címzett közötti kapcsolat stb.) is kiegészítik a rendszert, akkor elérhető a 70 százalékos felderítési arány.
Ludwig leszögezte, hogy az algoritmust alkalmazni lehetne akár a reklámok igazságtartalmának megvizsgálására és a cégek esetében a beszállítói ajánlatok ellenőrzésére. Nem szabad azt sem elfelejteni, hogy egy nagyon kényes területről van szó. Tanulmányok szerint átlagosan naponta több mint 200 valótlansággal szembesülünk, de ezek többsége egyáltalán nem rossz szándékú dolog, hanem csak egy bók vagy egy kis füllentés. De ha a hazugság már az emberi természet szerves része, akkor megpróbálhatnánk legalább egy kicsit jobban megérteni, hogy egyáltalán miért vezetjük meg egymást és mik ennek a jelei.
Van Laert érdekelné, hogy egyáltalán mi visz rá valakit arra, hogy hazudjon. De kutatni kellene azt is, hogy miért esik bele valaki egy hazug ember csapdájába és mit lehet tenni a megtévesztési manőverek átlátására. Korábban angol, német, svájci, bolgár, spanyol és kenyai szakemberek a Pheme európai uniós projekt keretében arra a kérdésre keresték a választ, hogy mennyire megbízhatóak a közösségi médián keresztül terjesztett információk. A tudósok a helyes információknak a hazugságoktól és félrevezető adatoktól való megkülönböztetésére többek között nyelvészeti és grafikus módszereket alkalmaztak, s azokat ötvözték a Big Data-elemzésekhez használt technológiákkal.