SG.hu

Kivehetetlen vízjelet készített az MI-által generált képekhez a Google

A képeken nem lehet látni, de szoftverrel könnyen felismerhető, és a szerkesztésbe sem zavar bele.



A Google DeepMind csapata úgy véli, hogy a generatív MI-eszközök akkor lesznek nagyszerűek, ha olyan eszközöket is létrehoznak, amelyek felismerik, hogy mit hozott létre az MI. "Rengeteg nyilvánvaló, nagy horderejű oka van ennek." - mondja Demis Hassabis, a Google DeepMind vezérigazgatója. "Minden alkalommal amikor erről és más rendszerekről beszélünk, felmerül a mélyhamisítás, a deepfake kérdése." Mivel 2024-ben sok országban választás lesz, Hassabis szerint egyre fontosabbá válik a mesterséges intelligenciával készült dolgokat azonosító és felismerő rendszerek kiépítése. Hassabis és csapata az elmúlt években egy ilyen eszközön dolgozott, és a Google ma tette közzé nyilvánosan. A SynthID nevet viseli, és lényegében arra szolgál, hogy az MI által generált képeket vízjelekkel lássa el, mégpedig úgy, hogy az az emberi szem számára észrevehetetlen, de egy erre a célra kifejlesztett felismerő eszközzel könnyen azonosítható legyen.

A vízjel a kép pixeleibe van beágyazva, de Hassabis szerint nem változtatja meg észrevehetően magát a képet. "Nem változtatja meg a képet, a kép minőségét vagy a kép élményét" - mondja. "De ellenáll a különböző átalakításoknak - vágás, méretváltoztatás, azaz minden olyan dolog, amivel a normál, hagyományos, egyszerű vízjelet próbáljuk meg megkerülni." Hassabis szerint a SynthID mögöttes modelljeinek fejlődésével a vízjel az emberek számára még kevésbé lesz érzékelhető, de a DeepMind eszközeivel még könnyebben felismerhető lesz.

Hassabis és a Google DeepMind egyelőre nem közölt ennél több műszaki részletet. "Minél többet árulunk el a működéséről, annál könnyebb lesz kijátszani a hackereknek és a rosszindulatú szervezeteknek" - mondja Hassabis. A SynthID először a Google saját eszközeinél kerül bevezetésre, a Vertex AI platformon és az Imagen képgenerátornál. A valós tesztek után Hassabis reményei szerint egyre javul majd, és a Google több helyen tudja majd használni és többet tud majd megosztani a működéséről.


Hassabis reményei szerint a SynthID végül az egész internetre kiterjedő szabvány lehet. Az alapötleteket akár más médiumokban, például videóban és szövegben is lehet használni. Ha a Google már bizonyította a technológia működését, "a kérdés a méretnövelés, a megosztás más partnerekkel, majd a civil társadalommal folytatott vita arról, hogy hová akarunk eljutni. Ez egy bétateszt, egy új dolog első próbálkozása, és nem a deepfake probléma megoldása." Hassabis szerint a SynthID-t Chrome-bővítményként lehet majd kínálni, vagy akár a böngészőbe beépítve, hogy az egész weben azonosítani tudja a generált képeket. De még kérdéses, hogy az eszköznek proaktívan kell megjelölnie minden generált anyagot, vagy várnia kell valamilyen lekérdezésre a felhasználótól? És hogyan jelöljék az MI-származást, például egy hatalmas piros háromszöggel vagy valami finomabbal?

A SynthID a Google Cloud Next konferenciáján mutatkozik be, amelyen a vállalat a Google Cloud és Workspace termékek új funkcióiról tájékoztatja üzleti ügyfeleit. Thomas Kurian, a Google Cloud vezérigazgatója szerint a Vertex AI platform használata robbanásszerűen növekszik: "A modellek egyre kifinomultabbak, és nagyon megugrott a modelleket használók száma". Kurian szerint az ügyfelek határozottan aggódnak a hamisítványok miatt, de ennél sokkal hétköznapibb MI-felismerési igényeik is vannak. "Sok ügyfelünk van, akik ezeket az eszközöket reklámszövegek mellé szánt képek készítésére használják" - mondja példaként - "és az eredeti képet akarják ellenőrizni. A kiskereskedelem egy másik nagy kérdés: egyes webshopok mesterséges intelligencia eszközöket használnak arra, hogy leírásokat generáljanak a hatalmas termékkatalógusukba, és biztosítaniuk kell, hogy a feltöltött termékfotók ne keveredjenek össze generált képekkel. Lehet, hogy ez nem olyan hírértékű felhasználás, mint a hamis Trump-fotók vagy a pufidzsekis pápa, de a mesterséges intelligencia már most is megjelenik a mindennapi üzleti életben.

Bármilyen mesterséges intelligencia-felismerő eszköz bevezetése garantáltan fegyverkezési verseny kezdetét jelenti. Sok esetben ez egy vesztes verseny: az OpenAI már lemondott egy olyan eszköz létrehozásáról, amely azonosítaná a saját ChatGPT chatbotja által írt szövegeket. Ha a SynthID beválik, az csak arra ösztönzi majd a hackereket és a fejlesztőket, hogy kreatív módszereket találjanak a rendszer megkerülésére, ami a Google DeepMindot a rendszer fejlesztésére kényszeríti, és így körbe-körbe járnak majd. Hassabis szerint csapata készen áll erre. "Valószínűleg frissítenünk kell majd, mint egy vírusirtót vagy valami hasonlót. Mindig résen kell lennünk egy új típusú támadással és új típusú átalakítással szemben. Korai lenne a skálázásról és a civil társadalmi vitákról gondolkodni, amíg nem bizonyítottuk be, hogy a technológia működik."

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • Csaba161 #3
    Ilyen vízjelszerűség már régóta van a bankjegyeknél:

    Counterfeit Deterrence System (CDS)

    a neve. (Ez nem EURion!, ami a forinton is van.)
    Ennek az algoritmusát nem ismerik még a képfeldolgozó
    vagy printer cégek sem, ahol beépítik a programjukba,
    mert ezen beépítést az algoritmus megalkotója csinálja.

    Az általatok kitalált módszerekkel nem szüntethetők meg.
    Az internetes tesztek szerint a Photoshop csak akkor nem
    detektálja, ha túl kis darabját veszik a bankjegynek. Ez alapján
    valószínűleg a vízjel Fourier-transzformáltja van valahogyan
    hozzáadva, mintegy hologramként, a pénz képéhez...
    (Azoknak, kik nem tudják: egy hologram kis darabjából is
    visszakapjuk az eredeti képe, csak sokkal rosszabb felbontásban.)
  • kvp #2
    Nagyon egyszeru az eltuntetese: Be kell olvasni, ez megadja a vizjel adatait, majd ezeket a mar ismert jeleket kell eltavolitani a kepbol. Mivel a vizjel egyfajta zajkent adodik hozza a kephez, ezert meg szebb, tisztabb is lesz tole a kep. Nem lepne meg, ha egy sima adaptiv zajszures is kiszedne, tudtan kivul.

    Az osszes vizjel csak akkor mukodik, ha a szerkesztest vegzo nem tud rola, hogy ott van es nem modositja a kepnek azt a tulajdonsagat, amibe a vizjel kodolva van. Jo pelda amikor az MI-vel generalt kepeken ott volt a forrasadatok ember altal jol lathato vizjele, de az MI nem tudta, hogy az nem a kep termeszetes resze.
  • Gabbbbbbbbbbbb #1
    Leesne az állam, ha ez túlélne egy kevés gauss blur-t, amit utánaélesítenek kicsit. Esetleg nálam okosabb emberek megoldották ezt valahogy pl. egyfajta színkódolással, de pl. AI-val is újra lehet rajzoltatni, annyira sokféle módszer van, ami nagyon destruktívan eltüntethet mindenféle ilyen dolgot, anélkül, hogy egy átlagembernek feltűnne bármi.