SG.hu

Át tudja venni a számítógép feletti irányítást az Anthropic új MI-eszköze

Az Anthropic mesterséges intelligenciával foglalkozó szoftvercég bejelentette új eszközét, amely képes átvenni az irányítást a felhasználó egérkurzora felett, és alapvető feladatokat elvégezni a számítógépen.

Az Anthropic Claude és Haiku modelljeinek egyéb fejlesztéseivel együtt bejelentett eszköz neve "Computer Use". Jelenleg kizárólag a vállalat középkategóriás 3.5 Sonnet modelljéhez érhető el egy API-n keresztül. A felhasználók többlépcsős utasításokat adhatnak, melyek az Anthropic állítása szerint akár több száz lépésig terjedhetnek. A felhasználó számítógépén végrehajtandó feladatok megoldhatók "a kurzor mozgatásával, gombok kattintásával és szöveg beírásával”. Működéséhez szükséges, hogy a Claude-nak megadják a szükséges hozzáférést, mely után az MI-modell megnézi a felhasználó számára is látható képernyőt, majd megszámolja, hogy függőlegesen vagy vízszintesen hány pixellel kell elmozgatnia a kurzort, hogy a megfelelő helyre kattintson. A modellnek természetesen vannak korlátai: gyorsan egymás után készített képernyőfotókkal dolgozik, nem pedig élő videófolyamot használ, így rövid ideig tartó értesítésekről vagy más változásokról lemaradhat. Nem képes egyes gyakori műveletekre, például a húzd és dobd-ra.

Az Anthropic kiemeli, hogy az eszköz még "hibalehetőségekkel teli”. Az eszköz fejlesztéséről szóló blogbejegyzés szerint a szoftver egy kódolási feladatot még a befejezés előtt abbahagyott, és helyette „a Yellowstone Nemzeti Park fotóit kezdte el böngészni”. Az eszköz nyilvános béta verzióban van, de olyan cégek alkalmazottai tesztelik, mint az Amazon, a Canva, az Asana és a Notion.


Természetesen a konkurens cégek - mint például az OpenAI - is dolgoznak egyenértékű eszközökön, de még nem tették azokat nyilvánosan elérhetővé. Ez afféle fegyverkezési verseny, mivel ezek az eszközök az előrejelzések szerint néhány éven belül rengeteg bevételt termelnek majd, ha a várakozásoknak megfelelően fejlődnek. Ezek az eszközök automatizálhatják az irodai munkák számos alantas feladatát, de a fejlesztők számára is hasznos eszköz lehet, mivel „automatizálhatják az ismétlődő feladatokat”, és racionalizálhatják a fáradságos minőségbiztosítási és optimalizálási munkát.

Ez a törekvés már régóta része az Anthropic befektetőknek szóló üzenetének: a mesterséges intelligencia eszközei egyes irodai munkák nagy részét hatékonyabban és olcsóbban tudnák elvégezni, mint az emberek. A Computer Use funkció nyilvános tesztelése egy lépés e cél elérése felé. Természetesen ilyenkor kell idézni az ilyen típusú eszközökkel kapcsolatos folyamatos vitát, mely szerint "ez csak egy eszköz, amely megkönnyíti az emberek munkáját” vagy pedig "egész iparágakban fog hatalmas munkanélküliséget okozni” - mindkettő megtörténhet bizonyos mértékig. A kérdés csak az, hogy milyen arányban - és ez helyzetenként vagy ágazatonként eltérő lehet.

A technológia széles körű elterjedésével kapcsolatban azonban számos jogos aggály merül fel. Az Anthropic becsületére legyen mondva, hogy megpróbálta megelőzni ezek egy részét azáltal, hogy már a kezdetektől fogva biztosítékokat épített be. "Tekintettel a közelgő amerikai választásokra, fokozottan figyeljük az olyan visszaélési kísérleteket, amelyek a választási folyamatokba vetett közbizalom aláásásának tűnhetnek. Intézkedéseket vezettünk be annak nyomon követésére, hogy mikor kérik Claude-ot választásokkal kapcsolatos tevékenységre, valamint olyan rendszereket, amelyek távol tartják Claude-ot az olyan tevékenységektől, mint a közösségi médiában való tartalom létrehozása és közzététele, webdomainek regisztrálása vagy a kormányzati webhelyekkel való interakció."

Ezek a biztosítékok nem biztos, hogy tökéletesek, mivel lehetnek kreatív módszerek a megkerülésükre, vagy más, még felfedezésre váró, nem szándékolt következmények vagy visszaélések. Az Anthropic jelenleg tesztelésre bocsátja a Computer Use-t, hogy megnézze, milyen problémák merülnek fel, és hogy a fejlesztőkkel együttműködve fejlessze a képességeit, és pozitív felhasználási lehetőségeket találjon.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • kvp #1
    "Az eszköz fejlesztéséről szóló blogbejegyzés szerint a szoftver egy kódolási feladatot még a befejezés előtt abbahagyott, és helyette „a Yellowstone Nemzeti Park fotóit kezdte el böngészni”."

    Ez alapjan megkockaztatom, hogy nemelyik MI mogott lehet egy indiai / afrikai munkas ul egy tavoli desktop-on at. Rabiznak feladatokat a szoftverre aztan meg meglepodnek, hogy a file-ok rendezese helyett egyszer csak a ceges konyvelo geperol miert utalt el par millio dollart az egyik "al"-lal kezdodo nevu tarsadalmi szervezetnek.