SG.hu
Honlap másolatokon tanítják be MI-ügynökeiket az IT-cégek
Több startup épít oldalreplikákat, hogy a mesterséges intelligencia megtanulja használni az internetet, és talán átvegye a fehérgalléros munkák egy részét.
A nyár folyamán a United Airlines jogászai felfigyeltek rá, hogy valaki egy szinte tökéletes másolatot készített a vállalat weboldaláról. Ez a digitális klón ugyanazokat a gombokat és menüket kínálta repülőjáratok, hotelek és autóbérlések foglalásához. Ugyanazokat a kék linkeket tartalmazta a törzsutas-mérföldek követésére és a kedvezményes ajánlatok böngészésére. Még a United márkanevét és logóját is használta. A United jogászai ezért hivatalos eltávolítási felszólítást küldtek, azzal vádolva a weboldalt, hogy megsérti a cég szerzői jogait.
Div Garg, akinek apró vállalkozása készítette a másolatot, azonnal megváltoztatta az oldal nevét „Fly Unified”-re, és eltávolította a United logóját. Nem állt szándékában a United szellemi tulajdonát ellopni, ő és cége csak azért építették meg a United.com másolatát, hogy az gyakorlóterepként szolgáljon a mesterséges intelligencia botok számára. Garg cége azon Szilícium-völgyi startupok közé tartozik, amelyek népszerű weboldalakat alkottak újra az elmúlt hónapokban, hogy az MI-rendszerek megtanuljanak önállóan eligazodni az interneten, és elvégezzenek bizonyos feladatokat, például repülőjáratot foglaljanak. Ha egy MI-rendszer megtanulja használni a United.com másolatát, akkor képes lesz használni az igazi oldalt is.
Ezek az új „árnyékoldalak” jelentős részét képezik annak a technológiai iparági törekvésnek, amely a jelenlegi chatbotokat MI-ügynökökké kívánja alakítani. Ezek olyan rendszerek, amelyeket utazásfoglalásra, meetingek ütemezésére, diagramok készítésére és egyéb számítógépes feladatok elvégzésére terveznek. Sok cég szerint az elkövetkező években az MI-ügynökök egyre kifinomultabbá válnak, és bizonyos irodai munkaköröket akár helyettesíthetnek is. „Olyan képzési környezeteket akarunk építeni, amelyek lefedik az egész munkakört, amit egy ember végez” - mondta Robert Farlow, akinek startupja, a Plato szintén népszerű weboldalakat és szoftveralkalmazásokat másol le.

Robert Farlow
Az új trend, amelyet Szilícium-völgyi kockázati tőke finanszíroz, jól mutatja, milyen messzire hajlandó elmenni a techipar a mesterséges intelligencia fejlesztéséhez szükséges hatalmas mennyiségű digitális adat felkutatásában. A Szilícium-völgy először összegyűjtötte a szövegeket, hangokat és képeket az internetről. Amikor sok oldal blokkolta ezeket a törekvéseket, a cégek új módszereket találtak mások adatainak megszerzésére. Most pedig weboldalakat hoznak létre a semmiből, hogy új adatot generáljanak.
Az elmúlt hónapokban Garg és cége tízmillió dolláros - többek között a Menlo Ventures által biztosított finanszírozással - olyan oldalakat klónozott, mint az Amazon, az Airbnb és a Gmail. Olyan neveket kaptak, mint Omnizon, Staynb vagy Go Mail. Ezek a másolatok lehetővé teszik az MI-rendszereknek, hogy próbálkozás és hibázás útján tanuljanak készségeket - a technikát a kutatók megerősítéses tanulásnak nevezik. Ahelyett, hogy emberek által generált adatokból tanulnának, azt tanulják meg, amit maguk generálnak, hatalmas mennyiségben.
Adódik a kérdés, hogy a Szilícium-völgy cégei miért nem valódi weboldalakon tréningezik az MI-rendszereket? Sok esetben ez nem lehetséges. Az olyan oldalak, mint az Amazon vagy az Airbnb gyakran tiltják a botokat, különösen akkor, ha a botok újra és újra ugyanazokat a feladatokat ismétlik - márpedig ez a megerősítéses tanulás alapvető része. „Amikor tréningezel, egyszerre több ezer MI-ügynököt akarsz futtatni, hogy bejárják az oldalt, különböző aloldalakat látogassanak meg, és mindenféle dolgokat kipróbáljanak” - mondta Garg. „Ha ezt egy valódi weboldalon próbálod meg, le fognak tiltani.”
A mai MI-rendszereket olyan matematikai rendszerek hajtják, amelyeket a tudósok neurális hálóknak neveznek. Ezek képesek mintázatokat felismerni szövegekben, képekben és hangokban. De körülbelül kilenc hónappal ezelőtt az olyan cégek, mint az OpenAI, gyakorlatilag felhasználták az interneten található összes angol nyelvű szöveget, ezért most egyre jobban támaszkodnak a megerősítéses tanulásra. Ez az eljárás hetekig vagy akár hónapokig is eltarthat, és eredetileg olyan területeken indult, mint a matematika és a számítógépes programozás. Ha az MI-rendszerek több ezer matematikai problémán mennek végig, megtanulják, mely lépések vezetnek a helyes megoldáshoz és melyek nem.
Most olyan cégek, mint az OpenAI, a Google, az Amazon és az Anthropic is ezt a technikát használják az MI-ügynökök építésére. Először valós weboldalak használatáról készült felvételeket alkalmaztak. Azzal, hogy kielemezték, miként mozgatta az egérmutatót vagy használta a billentyűzetet a levideózott felhasználó, amikor ebédet rendelt a DoorDash-en vagy számokat vitt be a Microsoft Excelbe, a rendszerek megtanulták önállóan használni ezeket az oldalakat. A munka felgyorsítása érdekében MI-cégek kevéssé ismert startupokat, például az AGI-t és a Platót fizetik meg azért, hogy olyan oldalreplikákat építsenek, amelyeken a botok extrém mennyiségű próba-hiba cikluson keresztül tanulhatnak. „Azt akarják, hogy az MI képes legyen kísérletezni a feladat elvégzésének összes lehetséges módjával” - mondta John Qian, akinek startupja, a Matrices MI-tréninghez készít weboldal-másolatokat. A munka nagy része a háttérben zajlik, de néhány esetben a startupok nyilvánosan is feltöltötték a másolat-oldalakat az internetre, hogy így hívják fel magukra a nagy MI-cégek - például az OpenAI, a Google és az Amazon - figyelmét.

John Qian
Miután eltávolította a vállalatneveket és logókat a saját startupja által készített replikákról, Garg nem tart további jogi lépésektől például a United Airlinestól. Qian is hasonlóan vélekedik, noha elismerte, hogy az MI-kutatás új jogi területre lépett, amely még nem teljesen rendezett. Robin Feldman, a San Franciscó-i UC Law jogi professzora szerint ezeknek az „árnyékoldalaknak” az MI-technológiák képzésére való használata sértheti olyan cégek szerzői jogait, mint a United Airlines. De a bíróságok végül arra is juthatnak - tette hozzá -, hogy ez megengedett a szerzői jogi törvények szerint. „A startupok előbb cselekszenek, és csak utána kérdeznek” - mondta Feldman. „A terület sokkal gyorsabban bővül annál, mint ahogy a jogi rendszer lépést tudna ezzel tartani. Néhány gyorsan meghozott döntés visszaüthet majd azokra a cégekre, amelyek ezeket a döntéseket meghozták.”
Az olyan cégek, mint az OpenAI és az Anthropic már kiadtak olyan kísérleti technológiákat, amelyek képesek vásárolni az Instacartról vagy jegyzetelni online szövegszerkesztőkben, például a Google Docsban. De ezek a technológiák gyakran hibáznak. Néha ez megakadályozza őket abban, hogy elvégezzék a kért feladatot. „Óriási szakadék van aközött, amit a cégek szeretnének, hogy ezek az ügynökök tegyenek, és aközött, amire ma képesek” - mondta Rayan Krishnan, a Vals AI vezérigazgatója, amely a legújabb MI-technológiák teljesítményét teszteli. „Ma ezek a rendszerek túlságosan lassúak ahhoz, hogy igazán hasznosak legyenek. Az ember hamarabb végigkattintja magát.”
A szakértők nem értenek egyet abban, milyen gyorsan halad majd előre ez a munka, vagy hogy a fogyasztók és a vállalatok akarják-e vagy egyáltalán szükségük van-e az ilyen szintű automatizálásra, és hogy a népszerű weboldalak engedni fogják-e. A múlt hónapban például az Amazon beperelte a Perplexity-t, amely olyan MI-t fejlesztett, amely az Amazon oldalán próbálta automatizálni a vásárlást. Az MI-cégek végső célja azonban az, hogy olyan rendszereket építsenek, amelyekkel szinte bármilyen irodai munka automatizálható. „Ha újra tudsz alkotni minden szoftvert és weboldalt, amelyet az emberek használnak, akkor be tudod tanítani az MI-t, hogy elvégezze ezeket a munkákat, és elkezdje még jobban végezni őket, mint egy ember” - mondta Farlow.
A nyár folyamán a United Airlines jogászai felfigyeltek rá, hogy valaki egy szinte tökéletes másolatot készített a vállalat weboldaláról. Ez a digitális klón ugyanazokat a gombokat és menüket kínálta repülőjáratok, hotelek és autóbérlések foglalásához. Ugyanazokat a kék linkeket tartalmazta a törzsutas-mérföldek követésére és a kedvezményes ajánlatok böngészésére. Még a United márkanevét és logóját is használta. A United jogászai ezért hivatalos eltávolítási felszólítást küldtek, azzal vádolva a weboldalt, hogy megsérti a cég szerzői jogait.
Div Garg, akinek apró vállalkozása készítette a másolatot, azonnal megváltoztatta az oldal nevét „Fly Unified”-re, és eltávolította a United logóját. Nem állt szándékában a United szellemi tulajdonát ellopni, ő és cége csak azért építették meg a United.com másolatát, hogy az gyakorlóterepként szolgáljon a mesterséges intelligencia botok számára. Garg cége azon Szilícium-völgyi startupok közé tartozik, amelyek népszerű weboldalakat alkottak újra az elmúlt hónapokban, hogy az MI-rendszerek megtanuljanak önállóan eligazodni az interneten, és elvégezzenek bizonyos feladatokat, például repülőjáratot foglaljanak. Ha egy MI-rendszer megtanulja használni a United.com másolatát, akkor képes lesz használni az igazi oldalt is.
Ezek az új „árnyékoldalak” jelentős részét képezik annak a technológiai iparági törekvésnek, amely a jelenlegi chatbotokat MI-ügynökökké kívánja alakítani. Ezek olyan rendszerek, amelyeket utazásfoglalásra, meetingek ütemezésére, diagramok készítésére és egyéb számítógépes feladatok elvégzésére terveznek. Sok cég szerint az elkövetkező években az MI-ügynökök egyre kifinomultabbá válnak, és bizonyos irodai munkaköröket akár helyettesíthetnek is. „Olyan képzési környezeteket akarunk építeni, amelyek lefedik az egész munkakört, amit egy ember végez” - mondta Robert Farlow, akinek startupja, a Plato szintén népszerű weboldalakat és szoftveralkalmazásokat másol le.

Robert Farlow
Az új trend, amelyet Szilícium-völgyi kockázati tőke finanszíroz, jól mutatja, milyen messzire hajlandó elmenni a techipar a mesterséges intelligencia fejlesztéséhez szükséges hatalmas mennyiségű digitális adat felkutatásában. A Szilícium-völgy először összegyűjtötte a szövegeket, hangokat és képeket az internetről. Amikor sok oldal blokkolta ezeket a törekvéseket, a cégek új módszereket találtak mások adatainak megszerzésére. Most pedig weboldalakat hoznak létre a semmiből, hogy új adatot generáljanak.
Az elmúlt hónapokban Garg és cége tízmillió dolláros - többek között a Menlo Ventures által biztosított finanszírozással - olyan oldalakat klónozott, mint az Amazon, az Airbnb és a Gmail. Olyan neveket kaptak, mint Omnizon, Staynb vagy Go Mail. Ezek a másolatok lehetővé teszik az MI-rendszereknek, hogy próbálkozás és hibázás útján tanuljanak készségeket - a technikát a kutatók megerősítéses tanulásnak nevezik. Ahelyett, hogy emberek által generált adatokból tanulnának, azt tanulják meg, amit maguk generálnak, hatalmas mennyiségben.
Adódik a kérdés, hogy a Szilícium-völgy cégei miért nem valódi weboldalakon tréningezik az MI-rendszereket? Sok esetben ez nem lehetséges. Az olyan oldalak, mint az Amazon vagy az Airbnb gyakran tiltják a botokat, különösen akkor, ha a botok újra és újra ugyanazokat a feladatokat ismétlik - márpedig ez a megerősítéses tanulás alapvető része. „Amikor tréningezel, egyszerre több ezer MI-ügynököt akarsz futtatni, hogy bejárják az oldalt, különböző aloldalakat látogassanak meg, és mindenféle dolgokat kipróbáljanak” - mondta Garg. „Ha ezt egy valódi weboldalon próbálod meg, le fognak tiltani.”
A mai MI-rendszereket olyan matematikai rendszerek hajtják, amelyeket a tudósok neurális hálóknak neveznek. Ezek képesek mintázatokat felismerni szövegekben, képekben és hangokban. De körülbelül kilenc hónappal ezelőtt az olyan cégek, mint az OpenAI, gyakorlatilag felhasználták az interneten található összes angol nyelvű szöveget, ezért most egyre jobban támaszkodnak a megerősítéses tanulásra. Ez az eljárás hetekig vagy akár hónapokig is eltarthat, és eredetileg olyan területeken indult, mint a matematika és a számítógépes programozás. Ha az MI-rendszerek több ezer matematikai problémán mennek végig, megtanulják, mely lépések vezetnek a helyes megoldáshoz és melyek nem.
Most olyan cégek, mint az OpenAI, a Google, az Amazon és az Anthropic is ezt a technikát használják az MI-ügynökök építésére. Először valós weboldalak használatáról készült felvételeket alkalmaztak. Azzal, hogy kielemezték, miként mozgatta az egérmutatót vagy használta a billentyűzetet a levideózott felhasználó, amikor ebédet rendelt a DoorDash-en vagy számokat vitt be a Microsoft Excelbe, a rendszerek megtanulták önállóan használni ezeket az oldalakat. A munka felgyorsítása érdekében MI-cégek kevéssé ismert startupokat, például az AGI-t és a Platót fizetik meg azért, hogy olyan oldalreplikákat építsenek, amelyeken a botok extrém mennyiségű próba-hiba cikluson keresztül tanulhatnak. „Azt akarják, hogy az MI képes legyen kísérletezni a feladat elvégzésének összes lehetséges módjával” - mondta John Qian, akinek startupja, a Matrices MI-tréninghez készít weboldal-másolatokat. A munka nagy része a háttérben zajlik, de néhány esetben a startupok nyilvánosan is feltöltötték a másolat-oldalakat az internetre, hogy így hívják fel magukra a nagy MI-cégek - például az OpenAI, a Google és az Amazon - figyelmét.

John Qian
Miután eltávolította a vállalatneveket és logókat a saját startupja által készített replikákról, Garg nem tart további jogi lépésektől például a United Airlinestól. Qian is hasonlóan vélekedik, noha elismerte, hogy az MI-kutatás új jogi területre lépett, amely még nem teljesen rendezett. Robin Feldman, a San Franciscó-i UC Law jogi professzora szerint ezeknek az „árnyékoldalaknak” az MI-technológiák képzésére való használata sértheti olyan cégek szerzői jogait, mint a United Airlines. De a bíróságok végül arra is juthatnak - tette hozzá -, hogy ez megengedett a szerzői jogi törvények szerint. „A startupok előbb cselekszenek, és csak utána kérdeznek” - mondta Feldman. „A terület sokkal gyorsabban bővül annál, mint ahogy a jogi rendszer lépést tudna ezzel tartani. Néhány gyorsan meghozott döntés visszaüthet majd azokra a cégekre, amelyek ezeket a döntéseket meghozták.”
Az olyan cégek, mint az OpenAI és az Anthropic már kiadtak olyan kísérleti technológiákat, amelyek képesek vásárolni az Instacartról vagy jegyzetelni online szövegszerkesztőkben, például a Google Docsban. De ezek a technológiák gyakran hibáznak. Néha ez megakadályozza őket abban, hogy elvégezzék a kért feladatot. „Óriási szakadék van aközött, amit a cégek szeretnének, hogy ezek az ügynökök tegyenek, és aközött, amire ma képesek” - mondta Rayan Krishnan, a Vals AI vezérigazgatója, amely a legújabb MI-technológiák teljesítményét teszteli. „Ma ezek a rendszerek túlságosan lassúak ahhoz, hogy igazán hasznosak legyenek. Az ember hamarabb végigkattintja magát.”
A szakértők nem értenek egyet abban, milyen gyorsan halad majd előre ez a munka, vagy hogy a fogyasztók és a vállalatok akarják-e vagy egyáltalán szükségük van-e az ilyen szintű automatizálásra, és hogy a népszerű weboldalak engedni fogják-e. A múlt hónapban például az Amazon beperelte a Perplexity-t, amely olyan MI-t fejlesztett, amely az Amazon oldalán próbálta automatizálni a vásárlást. Az MI-cégek végső célja azonban az, hogy olyan rendszereket építsenek, amelyekkel szinte bármilyen irodai munka automatizálható. „Ha újra tudsz alkotni minden szoftvert és weboldalt, amelyet az emberek használnak, akkor be tudod tanítani az MI-t, hogy elvégezze ezeket a munkákat, és elkezdje még jobban végezni őket, mint egy ember” - mondta Farlow.