Berta Sándor

Arcfelismerés - még pontatlan a technológia

Bár kétségkívül jelentős előrelépések történtek a területen, a precíz azonosítástól még nagyon messze vagyunk.

"Jelenleg az a furcsa helyzet van, hogy az arcfelismerést egyszerre túl- és alábecsülik. Tény, hogy egyes rendszerek jobban felismerik az arcokat, mint az emberek. Ez nyugtalanító. Ugyanakkor bizonyos teszteredmények nagyon rosszak, mert egyszerűen pontatlanok a rendszerek. Az arcfelismerő megoldások néhány évvel ezelőttig csak akkor működtek jól, ha az emberek a kamerákba néztek. Most viszont ott tartunk, hogy napszemüveg vagy sál kell a nehezen felismerhetőséghez. Minél erősebben eltakarja, annál nehezebb az azonosítása. Mi, emberek azonban akkor is felismerünk valakit, ha csak félig látjuk az arcát" - jelentette ki Florian Gallwitz, a Nürnbergi Műszaki Főiskola médiainformatikai professzora, aki többek között a mintafelismerést kutatja.

A szakember példaként említette, hogy New Yorkban vannak olyan kamerák, amelyek felismerik a rendszámokat. Ugyanakkor a helyiek szerették volna, ha a készülékek az autókban lévő vezetőket is azonosítják, ez viszont már nem működött, mert a kamerák egyetlen személyt sem ismertek fel. Ez részben arra volt visszavezethető, hogy a gépkocsikban sötétebb van, ráadásul a szélvédő is tükröződik.


Az arcfelismerő rendszerek eleve rosszabbul működnek sötétben, például éjszaka. Tudományos szempontból ugyanakkor nagy előrelépést sikerült elérni, ami elsősorban a mesterséges neurális hálózatoknak köszönhető. Azok ugyanis önállóan tudják azonosítani a különböző mintákat, ezáltal drámai mértékben csökkentek a hibaarányok. A friss eredmények ennek ellenére sem meggyőzőek és nem is igazán jobbak az évtizeddel ezelőtti eredményeknél.

"Nagyon valószínűtlen az, hogy egy terrorista egy ellenőrzött hely előtt fog átszaladni. Minél kisebb a járókelők tömegén belül a keresett személyek aránya, annál nagyobb lesz a téves azonosítás lehetősége. Egy rendszer tehát többnyire akkor azonosít majd személyeket terroristaként, ha ők semmit sem tettek. Ettől függetlenül fontos, hogy ne ítéljük el az arcfelismerést. A mostani rendszerek először is azt számolják ki, hogy két kép hasonló-e. A technológia számára az teljesen mindegy, hogy mi lesz az eredményekkel."

"Fontos lenne, hogy ne absztrakt etikai vita kezdődjön az arcfelismerésről, hanem a felek konkrét alkalmazási esetekről beszélgessenek. Szerintem például teljesen problémamentes dolog az, hogy valaki az arcfotójával zárja le a mobiltelefonját vagy a lakásajtaját. De ugyanígy rendben van-e, ha a rendőrség visszamenőlegesen elemez ki videofelvételeket? Egyszerűen meg kell találni a megfelelő egyensúlyt és fel kell tenni a kérdést, hogy mit akarunk engedélyezni és mit nem" - hangsúlyozta Florian Gallwitz.

A labdarúgó Bajnokok Ligája 2017-es döntőjének helyszínén, Cardiffban 170 000 látogatót arcát szkennelte be a walesi rendőrség, majd a felvételeket összehasonlította az adatbázisokban tárolt bűnözői fotókkal. Az alkalmazott szoftver 2470 személyt azonosított bűnözőként, összesen 450 embert őrizetbe is vettek. De később kiderült, hogy az érintetteknek csak a 7 százaléka, 173 személy volt valóban bűnöző és 2297 embert tévesen tartóztattak le, vagyis a rendszer 92 százalékos hibaaránnyal dolgozott. Kínában szintén hatalmasat hibázott a helyi arcfelismerő rendszer, amikor téves azonosítás után pellengérre állította az egyik legnagyobb cég vezetőjét, hatalmas kivetítőkön megjelenítve az arcát és az igazolványszámát, merthogy állítólag átment a piros lámpánál. Április elején pedig ismertté vált, hogy New Yorkban nem működik a felszerelt arcfelismerő rendszer, amelynek a segítségével vissza akarták szorítani a bűnözést. Az első eredmények katasztrofálisak lettek és a rendszer egyetlen arcot sem tudott azonosítani.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • Macropus Rufus #8
    és egy ilyen pontatlan technológiát tesznek kötelezővé:

    https://index.hu/techtud/2019/10/14/kinaban_mar_csak_arcszken_utan_lehet_uj_okostelefont_vasarolni/
  • Sir Cryalot #7
    Szoftver épít szarból várat?
    https://www.semanticscholar.org/paper/Event-based-Vision%3A-A-Survey-Gallego-Delbr%C3%BCck/d3fe000513e6d70220e3c27dbf6f8a2e4b9cd1c0
  • Nos #6
    Nem gondolom, hogy a szenzorgyártókra tartozik at arcfelismerő rendszerek optimalizálása. Elég messze van a két terület egymástól. Az egyik egy hardveres feladat, ahol minél jobb képet kell tudni előállítani mindenféle fényviszonyok között bármiről, nem csak arcokról. A másik meg egy deep learning network optimalizálásának a problémája. Persze nagyon rossz képből nem lehet nagyon szuper eredményeket csinálni, de egy jól bevilágított stadionban azért ma már nem probléma baromi jó képeket csinálni bárkiről, akár tízezrével. Nem hiszem, hogy valami műholdról készült egy darab fotó és azt használták :) A probléma inkább ott van, hogy ezek az arcfelismerők még optimális minőségű fotók esetében is tévednek. Számomra érdekes volt például, hogy az amazon face detektora nem az ázsiaiak esetében tévedet nagyobbakat, hanem a fekete nőknél: https://www.vox.com/the-goods/2019/1/28/18201204/amazon-facial-recognition-dark-skinned-women-mit-study.
  • Tetsuo #5
    "Azok ugyanis önállóan tudják azonosítani a különböző mintákat,... " Ez mit jelent?
    Rögtön utána:
    "...Ezáltal drámai mértékben csökkentek a hibaarányok. A friss eredmények ennek ellenére sem meggyőzőek és nem is igazán jobbak az évtizeddel ezelőtti eredményeknél."
    Durva ellentmondás, nem?
  • csicso82 #4
    Ez a fotót embernek nézés is érdekes de 3D kamera esetén ez sem szabadna, hogy megtörténjen.
  • kvp #3
    Van sztereokameras rendszer is, csak abbol a megfelelo felbontasu tul draga. Egyebkent foleg a felbontason verzik el a legtobb megoldas, ugyanis az emberi szem egy kis teruleten lat jo felbontassal, de gyorsan at tudunk fokuszalni. Ugyanehez stadion meretben, statikus kamerakkal mar gigapixeles szereokamera rendszerek kellenek. Tehat nem az algoritmusok benaznak hanem a szenzor gyartok es az adatbazisok osszeallitoi. Sztereo vagy 3 kameras, melysegi terkepes, szembol, ketoldalrol felvett adatbazist hasznalva egy gigapixeles sztereokepes mintan mar a sal/szemuveg se lesz gond, csak annyira mint egy valodi embernek. A felismeresi sebesseg kerdeses meg, ugyanis egy stadionnyi embert egy valodi ember csak honapok alatt tudna atnezni. Egy gep eseten is eleg massziv szamitasi teljesitmenyt kellene rovid idore alatolni, felho alapon. Ha ez nincs, akkor a mintaminoseg csokkentesevel skalaznak fel, ami a talalati pontossag csokkeneset hozza.

    ps: Erdekes de Kinaban kepesek komplett szerverfarmokat alatolni egy kozlekedesi kihagasokat kezelo rendszernek is. Ott nem felcserelte az embereket a rendszer hanem egy nagyobb fotot nezett elo embernek. Az klasszikus programhiba, nem mintafelismeresi hiba.
  • csicso82 #2
    "Most viszont ott tartunk, hogy napszemüveg vagy sál kell a nehezen felismerhetőséghez. Minél erősebben eltakarja, annál nehezebb az azonosítása. Mi, emberek azonban akkor is felismerünk valakit, ha csak félig látjuk az arcát"

    Ez egy kulcs gondolat, nagyon érdekes, hogy az emberi szem és agy mennyire intelligensebb, szerintem az egyik gond az arcfelismeréssel - csak tipp - hogy nem 3D-ben történik hiszen csak egy kamera nézi az arcot lehet a szoftver teljesítményén is javítana ha sztereo kamerák lennének.
  • Sir Cryalot #1
    Normális esetben ez a szenzorgyártók terepe lenne, nem pedig önjelölt Uwe Böllér-eké dehát mint tudjuk a nárcisztikus országok a faszaság példaképei akiknek nem törik bele a foga semmibe, főleg nem a szaros palacsintákba ami nincs :DDDD