SG.hu

A gépi látás fejlesztésének fő célja az emberek nyomon követése

42 000 tanulmány és szabadalom elemzése azt mutatja, hogy a mesterséges látás terén elért kutatások a tömeges megfigyelési technológiák fejlesztésére összpontosítanak.

Ma már számítógépes látást használnak a teniszlabdák helyzetének meghatározásához ugyanúgy, mint a focin a les figyeléséhez vagy a sportolók testtartásának szükséges korrekciójához a sérülések elkerülése érdekében. A mesterséges intelligencia ezen ága áll a fotókon szereplő barátok automatikus azonosítása, az önvezető autók és más olyan ma még gyerekcipőben járó technológiák, mint a robotika vagy az új fehérjék felfedezése mögött is. De egy a Nature-ben megjelent tanulmány szerint a mesterséges látás legfőbb tárgyai mi, emberek vagyunk. A vezető tudományos folyóiratban megjelent tanulmányok és az azokból származó szabadalmak túlnyomó többsége az emberekre, azok különböző testrészeinek azonosítására, tevékenységükre és mozgásuk környezetére összpontosít.

Amerikai és európai egyetemek kutatói több ezer cikket és több ezer, 1990 óta benyújtott vagy bejegyzett szabadalmat gyűjtöttek össze, amikor még a mesterséges látás kutatása a tudományos fantasztikum határát súrolta. Akkoriban az információk kinyerése egy képből vagy videóból még nagy kihívást jelentett a gépek számára. Ez ma is így van, amint azt a vizuális CAPTCHA használata is bizonyít, amellyel igazoljuk, hogy emberek vagyunk. Azonban a mesterséges látás mind az adatok elemzésének, mind azok értelmezésének képessége terén nagy előrelépéseket tett. Számos területen segít ez a technológia az embereknek, de van egy másik oldal is, és mint kiderült, az hatalmas.

Körülbelül harminc kulcsszóra támaszkodva, amelyek közül néhány olyan egyértelmű, mint a megfigyelés vagy az arcfelismerés, mások pedig nem annyira nyilvánvalóak, mint az írisz vagy a repülőtér, a kutatók 19 000, a mesterséges látásról szóló cikket elemeztek, amelyeket egy több mint 30 éve megrendezett, az ágazat számára fontos éves konferencián mutattak be. Ugyanezt tették 23 000, ezekből a munkákból származó bejegyzett szabadalommal is. Az előbbiek bemutatják az elért eredményeket, az utóbbiak pedig tesznek arról, hogy csak a szerzők tudják kihasználni ezeket.

A szerzők a Nature cikkükben így foglalják össze az eredményeket: "Felfedeztük, hogy a tanulmányok 90%-a és a származtatott szabadalmak 86%-a emberi lényekkel kapcsolatos adatokat tartalmazott”. A munkák többsége, több mint kétharmada, az emberi test egészéről vagy annak bizonyos részeiről, különösen az arcról szóló információk megszerzésével foglalkozott. A cikkek és szabadalmak egy másik része (18%, illetve 16%) emberi terekről, például a munkahelyről, az otthonról vagy a közlekedési területekről származó adatokat tartalmazott. Egy kisebb, de nem elhanyagolható, 1%-os arány (5% a szabadalmak esetében) tartozik abba a kategóriába, amelyet a kutatók „társadalmi szempontból releváns emberi adatoknak” neveztek, és amelynek célja, hogy a gépek megértsék az emberi lelkiállapotokat, gazdasági helyzetet, kulturális hovatartozást.


Ha ezeket az eredményeket időrendbe állítjuk, akkor láthatóvá válik egy egész ökoszisztéma kialakulása a tömeges és automatizált megfigyelési technológiák terén. Az 1990-es évek elején csak néhány száz kutatást és szabadalmat találtak a mesterséges látás területén, és ezeknek alig a fele foglalkozott emberi adatok elemzésével. Két évtizeddel később az éves cikkek és szabadalmak száma megháromszorozódott, és már 78%-uk emberi adatokra összpontosított. A gépi látás kutatásának abszolút növekedését és az emberekre összpontosító munkák relatív növekedését összevetve a gépi látás felügyeleti tudománya ötszörösére nőtt.

"Nehéz egyértelmű okot megállapítani a felügyelettel kapcsolatos cikkek és szabadalmak számának jelentős növekedésére” - ismeri el Abeba Birhane, a dublini Trinity College kutatója és a tanulmány vezető szerzője. Ugyanakkor néhány tényezőt kiemel: "A mesterséges látás területén elért technikai fejlődés, a kritikák és a társadalmi tudatosság hiánya ezen a területen, az intézményi struktúrák, amelyek jutalmazzák a megfigyelést, vagy a technológiával kapcsolatos mágikus gondolkodás, amely feltételezi, hogy a megfigyelési technológiák a politikai és kulturális problémák megoldását jelentik”. Emellett megemlíti a finanszírozás jelentős növekedését is, ami a megfigyelésből hasznot húzó szervezetek érdeklődésének köszönhető, legyen az hatalom, ellenőrzés vagy gazdasági haszon.

Egy másik, a szerzők által feltárt adat a kutatások koncentrációja. Az Egyesült Államok az összes ország közül kiemelkedik, több kutatást végez, mint az összes többi ország együttvéve. Némi lemaradással, de jóval megelőzve a harmadik helyen álló országot (Egyesült Királyság) Kína áll. Ez nem meglepő. Egyrészt ez két technológiai szuperhatalom, függetlenül a szóban forgó technológia tárgyától vagy felhasználásától. Ezenkívül a kínai rezsim tekintélyelvű jellege, valamint az amerikai hadiipar és védelmi ipar és a csúcstechnológiák közötti kapcsolat magyarázza a többit. A következő generációs mesterséges intelligencia (nem feltétlenül a gépi látáshoz kapcsolódó) két legjelentősebb szereplője, a Palantir és az Anduril együttműködik az amerikai nemzetbiztonsággal. Az előbbi már egy olyan rendszert fejleszt a Trump-kormányzat számára, amely a bevándorlókat veszi célba. A ChatGPT-t létrehozó OpenAI pedig nemrég írt alá megállapodást az amerikai védelmi minisztériummal.

A Nature-ben megjelent kommentárban Jathan Sadowski, a Monash Egyetem (Ausztrália) kutatója a tanulmány egyik eredményét tárgyalja. A szerzők elemezték a tanulmányokban és szabadalmakban használt nyelvezet alakulását, és azt a tendenciát észlelték, hogy a célokat egyre semlegesebb szavakkal vagy azok teljes elhagyásával igyekeznek elrejteni. Például az emberekre való hivatkozás egyre ritkábban jelenik meg, annak ellenére, hogy a tanulmányok tárgyát ők képezik, és olyan kifejezésekkel helyettesítik őket, mint például a tárgyak.

"Az emberekre tárgyként való hivatkozás egyszerűen a mérnöki munka rövidítésének tekinthető” - írja Sadowski. Ez illeszkedne a technológiai nyelv általánosabb trendjébe. A tudós számára azonban nem egyszerű könnyedén figyelmen kívül hagyni ezeket a dehumanizáló gyakorlatokat: "Ezeket a technológiákat egy olyan politikai és gazdasági környezetben hozzák létre, amelyben a nagyvállalatok, valamint a katonai és rendőri intézmények érdekei óriási befolyással bírnak a mesterséges intelligencia rendszerek tervezésére és használatára."

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • kvp #2
    Alapvetoen a legtobb gepi latasi feladatnak katonai felhasznalasa van. Az emberek megfigyelese is katonai felhasznalas, csak a sajat civil lakossag ellen. Az ipari feladatokat joreszt mar megoldottak, mert a kontrollalt kornyezet miatt azok voltak a konnyebbek, mig a haztartasi feladatok (fekete zokni keresere a sotet szonyegen) meg mindig kihivast jelentenek a mernokoknek es penz se nagyon van benne. Jelenleg a katonai felhasznalas hoz nagyobb hasznot, tehat ezt fogjak fejleszteni.
  • Kotomicuki #1
    "A gépi látás fejlesztésének fő célja az emberek nyomon követése."

    Miért nem lepődtem meg?
    Ahogy minden más technológia fejlesztése is először az ember(iség) ellen kezdődik a (már rég elavult) társadalmi berendezkedés miatt, majd, hogy legyen pénz a továbbfejlesztésére, csöpögtetnek vmennyit a másik oldalra is.