Sg.hu - Az Anthropic új MI-modellje majdnem egy teljes munkanapot képes egyhuzamban dolgozni

2025. május 23. 14:08, péntek

SG.hu

Az Anthropic új MI-modellje majdnem egy teljes munkanapot képes egyhuzamban dolgozni

Az Anthropic mesterséges intelligenciával foglalkozó startup cég szerint az új MI-modellje majdnem hét órán át képes egyhuzamban dolgozni, ami újabb jele annak, hogy az MI hamarosan teljes műszakokban végezheti el a jelenleg emberek által végzett munkát.

A csütörtökön megtartott első fejlesztői konferenciáján az Anthropic két új MI-modellt mutatott be, amelyek a startup szerint az iparág legjobbjai közé tartoznak, legalábbis a népszerű benchmarkok alapján. Az Anthropic új Claude 4 modellcsaládjába tartozó Claude Opus 4 és Claude Sonnet 4 a vállalat szerint képes nagy adathalmazok elemzésére, hosszú távú feladatok és összetett műveletek végrehajtására. Az Anthropic szerint mindkét modellt úgy hangolták, hogy jól teljesítsenek a programozási feladatokban, így kiválóan alkalmasak a kódok írására és szerkesztésére.

A Sonnet 4-hez a fizető felhasználók és a vállalat ingyenes chatbot-alkalmazásainak felhasználói is hozzáférnek, de az Opus 4-hez csak a fizető felhasználók kapnak hozzáférést. Az Anthropic API-ja számára az Amazon Bedrock platformján és a Google Vertex AI-n keresztül az Opus 4 ára 15 dollár/75 dollár millió tokenenként (input/output), a Sonnet 4 ára pedig 3 dollár/15 dollár millió tokenenként (input/output). A tokenek azok a nyers adatdarabok, amelyekkel az MI modellek dolgoznak. Egymillió token körülbelül 750 000 szónak felel meg - ez nagyjából 163 000 szóval hosszabb, mint a „Háború és béke”.

Az új modell egy lépéssel közelebb viheti a mesterséges intelligenciát a munkahelyek kiváltásához, miközben a technológiai óriások egyre erősebb mesterséges intelligenciák kifejlesztéséért versenyeznek. Ez változást jelenthet abban, ahogyan az emberek az MI-t a munkahelyükön használják, és a digitális ügynököket már nem egyedi feladatok elvégzésére kérik, hanem szélesebb körű célt adnak ezeknek az eszközöknek - hasonlóan ahhoz, ahogyan az ember utasítana egy alkalmazottat vagy munkatársat.

Az új modell nagyobb, összetettebb projekteket képes kezelni, körülbelül egy teljes munkanapig képes önállóan működni, további emberi utasítások nélkül. Bár ez nem egészen egy az egyben egyezik meg azzal a munkanappal, amelyet egy ember csinál, amikor projektek vagy feladatok között váltogat, mégis jelentős előrelépés. Az Anthropic szerint az asszisztens inkább a munkanap hétköznapi aspektusainak automatizálására szolgálhat, mintsem a szerepek megszüntetésére. "Ezek olyan kihívást jelentő dolgok, amelyek az emberek napjának harmadát jelenthetik, de nem feltétlenül teljesítik ki vagy bővítik szakmailag, de szükségesek ahhoz, hogy sikeres legyen a munkájában” - mondta Scott White, a Claude.ai nevű mesterséges intelligencia asszisztens termékvezetője.

White egy olyan marketinges példáját hozta fel, aki a korábbi teljesítményt szeretné elemezni egy új hirdetési stratégia kidolgozásához. A Claude Opus 4 képes lenne elemezni a jelenlegi stratégiát, átnézné a vállalat Facebook- és Google-hirdetéseit, hogy felmérje azok teljesítményét, észrevenné a különbséget a két kampány között, majd javaslatokat tenne arra vonatkozóan, hogy miért teljesítettek másképp. "Ez alapvetően azt jelenti, hogy a Claude képes hosszú időn keresztül mélyen gondolkodni és érvelni a célokról, miközben az érvelési képességeinél egy eszközkészletet is használ, hogy új szemszögből nézze a problémákat, és továbbvigye a feladatot” - mondta.

Az Anthropic modellje akkor érkezik, amikor egyre több vállalat fektet be a mesterséges intelligenciába. A Menlo Ventures kockázati tőkebefektető cég - amely szintén az Anthropic befektetője - felmérése szerint a generatív MI-ra - az olyan típusú MI-ra, amely képes tartalmat létrehozni és olyan szolgáltatásokat működtet, mint a ChatGPT és a Claude - fordított vállalati kiadások 2024-ben hatszorosára nőttek 2023-hoz képest. A cég szerint az Anthropic megduplázta a részesedését és ezzel megkérdőjelezi az OpenAI domináns pozícióját az üzleti MI-szolgáltatások piacán. A McKinsey jelentése szerint a vállalatok 92%-a tervezi, hogy a következő három évben növeli a generatív MI-be történő beruházásokat.

És az Anthropic messze nem az egyetlen, amelyik a fejlesztéseit készpénzre akarja váltani. A Google kedden jelentette be, hogy autonóm kódoló eszköze, a Jules elérhetővé válik a nyilvánosság számára, míg a Microsoft hétfőn egy fejlett kódolási asszisztenst mutatott be a Github fejlesztési platformjához. Az Apple állítólag az Anthropic-kal dolgozik egy új eszközön, amely képes kódot írni és tesztelni.

Ugyanakkor a szakértők egyre inkább arra figyelmeztetnek, hogy a mesterséges intelligencia munkahelyek megszűnéséhez vezethet. A Világgazdasági Fórum idén év elején kiadott, a munkahelyek jövőjéről szóló jelentése szerint a munkáltatók 41%-a tervez leépítést, mivel a generatív MI egyre nagyobb szerepet játszik az emberek által végzett feladatokban.

Az Anthropic munkatársa, White úgy véli, hogy az MI megkönnyíti majd az emberek számára, hogy a formális képzettségükön túl is fejlődjenek, például egy mérnök, aki az MI segítségével tervez egy vizuális makettet mindenféle tervezői képzés nélkül. Ugyanakkor elismerte, hogy foglalkozni kell az MI munkaerőre gyakorolt hatásának kérdésével. "Ez nem olyasmi, amivel az Anthropic egyedül foglalkozni tud” - mondta. "Ebben a kormányoknak, a politikai döntéshozóknak és sok vállalatnak együtt kell működnie, hogy megértsük annak ívét, hogyan fog ez megvalósulni." Az Anthropic a Google-t is a támogatói között tartja számon, de ettől még a vállalat jelentősen növelni kívánja bevételeit. A jelentések szerint az ex-OpenAI kutatók által alapított cég célja, hogy 2027-re 12 milliárd dolláros bevételt érjen el, szemben az idei 2,2 milliárd dollárral. Az Anthropic nemrégiben 2,5 milliárd dolláros hitelkeretet vett fel és milliárdokat gyűjtött az Amazontól és más befektetőktől a modellek fejlesztésével járó növekvő költségek miatt.

Az Anthropic szigorú biztonsági intézkedések mellett adja ki az Opus 4-et, beleértve a káros tartalmak felerősített detektorát és a kiberbiztonsági védelmet. A vállalat azt állítja, hogy belső tesztjei szerint az Opus 4 „jelentősen megnövelheti” egy STEM háttérrel rendelkező személy képességét a vegyi, biológiai vagy nukleáris fegyverek megszerzésére, előállítására vagy bevetésére. Mind az Opus 4, mind a Sonnet 4 „hibrid” modellek, amelyek képesek a szinte azonnali válaszadásra és a mélyebb gondolkodásra (amennyiben az MI képes "gondolkodni" - ahogyan az emberek értik ezeket a fogalmakat). Bekapcsolt érvelési üzemmódban a modellek több időt tudnak szánni arra, hogy egy adott probléma lehetséges megoldásait mérlegeljék, mielőtt válaszolnának.

Ahogy a modellek érvelnek, egy „felhasználóbarát” összefoglalót fognak mutatni a gondolkodási folyamatukról, mondja az Anthropic. Miért nem mutatja meg az egészet? Részben az Anthropic „versenyelőnyeinek” védelme érdekében, ismeri el a vállalat. Az Opus 4 és a Sonnet 4 több eszközt, például keresőmotorokat is használhat párhuzamosan, és váltogathatja az érvelést és az eszközöket, hogy javítsa a válaszok minőségét. A feladatok megbízhatóbb kezelése érdekében képesek a tények „memóriába” való kivonására és elmentésére is, így idővel felépítik azt, amit az Anthropic „hallgatólagos tudásként” ír le.

A modellek programozóbarátabbá tétele érdekében a cég lehetővé teszi a fejlesztők számára, hogy közvetlenül egy terminálról futtassanak bizonyos feladatokat, és a modell mostantól integrálható az IDE-kkel, és SDK-t kínál, amely lehetővé teszi a fejlesztők számára, hogy harmadik féltől származó alkalmazásokkal kapcsolják össze. A cég által szintén bejelentett Claude Code SDK lehetővé teszi a Claude Code alfolyamatként történő futtatását a támogatott operációs rendszereken, és módot ad a Claude modellek képességeit kihasználó, mesterséges intelligenciával működő kódolási asszisztensek és eszközök létrehozására. Az Anthropic Claude Code bővítményeket adott ki a Microsoft VS Code, a JetBrains és a GitHub számára. A GitHub-interfészlehetővé teszi a fejlesztők számára, hogy a Claude Code reagáljon a visszajelzésekre, valamint hogy megpróbálja kijavítani a kódban lévő hibákat - vagy más módon módosítani - a kódot.

A mesterséges intelligencia modellek még mindig küzdenek a minőségi szoftverkódolással. A kódgeneráló MI hajlamos biztonsági réseket és hibákat bevezetni, olyan területek gyengeségei miatt, mint például a programozási logika megértésének képessége. Mégis, a kódolási termelékenység növelésének ígérete arra ösztönzi a vállalatokat - és a fejlesztőket -, hogy hamar bevezessék azokat. Az Anthropic - amely ennek tudatában van - gyakoribb modellfrissítéseket ígér. "Gyakoribb modellfrissítésekre térünk át, olyan fejlesztések folyamatos áramlását nyújtva, amelyek gyorsabban hozzák el az áttörést jelentő képességeket az ügyfelek számára” - írta a startup. "Ez a megközelítés az élvonalban tartja Önt, mivel folyamatosan finomítjuk és fejlesztjük modelljeinket."

Informatika és tudomány

Az Anthropic új MI-modellje majdnem egy teljes munkanapot képes egyhuzamban dolgozni

Hozzászólások

Bejelentkezés