Gyorsan kimerülő kvótákra panaszkodnak az Anthropic MI-jét használó fejlesztők

Az utóbbi hetekben egyre több fejlesztő számol be arról, hogy az Anthropic által fejlesztett Claude Code nevű programozási asszisztens használata során váratlanul gyorsan elfogy a rendelkezésre álló kvóta. A mesterséges intelligenciára épülő eszközt sok programozó napi munkafolyamatokba integrálta, ezért a jelenség komoly fennakadásokat okoz a fejlesztési folyamatokban, különösen azoknál, akik automatizált rendszerekben használják a szolgáltatást.

A problémát maga az Anthropic is elismerte. A vállalat közlése szerint "az emberek sokkal gyorsabban érik el a Claude Code használati korlátait, mint ahogyan azt vártuk. Aktívan vizsgáljuk az ügyet, ez jelenleg a csapat legfontosabb prioritása". A vállalat szerint a hiba feltárása és a használati modell pontosítása folyamatban van, de egyelőre nem világos, pontosan mi okozza a jelenséget. A fejlesztők visszajelzései alapján a probléma többféle formában jelentkezik. Egy Claude Pro előfizető, aki évi 200 dollárt fizet a szolgáltatásért, az Anthropic Discord fórumán arról számolt be, hogy a használati kerete általában már a hét elején elfogy. Mint írta: "Már hétfőn eléri a maximumot és csak szombaton áll vissza. Ez már pár hete így van. Harminc napból összesen tizenkettőn tudom használni a Claude-ot." A Redditen működő Anthropic közösségi fórumon hasonló panaszok sorakoznak. Egy fejlesztő például azt írta, hogy a Max 5 csomagját rendkívül gyorsan kimerítette. "Egy óra munka alatt elfogyott a Max 5. Korábban nyolc órát tudtam dolgozni vele." Ez a csomag havonta 100 dollárba kerül.

A jelenség mögött több lehetséges ok állhat. Az egyik, hogy az Anthropic nemrég módosította a kvótarendszer működését. A vállalat a múlt héten jelentette be, hogy a csúcsidőszakokban csökkenti a felhasználási kereteket. A cég egyik mérnöke, Thariq Shihipar szerint ez a változtatás a felhasználók körülbelül 7 százalékát érinti. Ugyanakkor azt is hangsúlyozta, hogy a fejlesztők számos hatékonysági fejlesztést vezettek be, amelyek ellensúlyozzák a csökkentett kvótát. A helyzetet tovább bonyolította egy promóciós kampány lejárata is. Március 28-ig egy akció keretében a Claude használati limitjei megduplázódtak a napi hatórás csúcsidőszakon kívül. Amikor ez a kedvezmény megszűnt, sok felhasználó hirtelen sokkal szigorúbb korlátokkal találta szembe magát.

Egy harmadik lehetséges ok a szoftverben található hibákhoz kapcsolódik. Egy fejlesztő azt állítja, hogy visszafejtette a Claude Code bináris állományát, és két különálló hibát talált, amelyek megszakítják az úgynevezett prompt cache működését. Állítása szerint ez akár tízszeres vagy húszszoros tokenfogyasztást is okozhat anélkül, hogy a felhasználó ezt észrevenné. A beszámoló szerint a hiba "csendben felfújja a költségeket tíz-húszszorosára". Több felhasználó azt jelezte, hogy a program korábbi verziójára való visszatérés valóban csökkentette a tokenhasználatot. Egy fejlesztő megerősítette: "A 2.1.34-es verzióra való visszalépés nagyon észrevehető különbséget hozott."

A tokenhasználat kérdése kulcsfontosságú a Claude Code működésében. A mesterséges intelligencia rendszerek úgynevezett tokenekben mérik a feldolgozott szöveg mennyiségét. Minden kérés, válasz vagy feldolgozott adat tokenekből áll, és ezek fogyasztják a felhasználó kvótáját. A hatékony működés érdekében a Claude egy gyorsítótárat, úgynevezett prompt cache-t használ. Ez lehetővé teszi, hogy az ismétlődő feladatok vagy hasonló kérések feldolgozása gyorsabb és olcsóbb legyen. A dokumentáció szerint a cache "jelentősen csökkenti a feldolgozási időt és a költségeket az ismétlődő feladatok vagy azonos elemeket tartalmazó promptok esetében". A rendszer azonban alapértelmezésben csak öt percig tartja meg a gyorsítótárazott adatokat.

Ha a felhasználó rövid szünetet tart, vagy pár percig nem használja a rendszert, a cache törlődik, és a következő kérés ismét teljes tokenfogyasztással fut le. A fejlesztők ugyan meghosszabbíthatják a cache élettartamát egy órára, de ennek ára van. A dokumentáció szerint "az egyórás cache írási tokenjei a normál bemeneti tokenek árának kétszeresébe kerülnek". A cache-ből történő olvasás viszont sokkal olcsóbb, mindössze az alapár egytizedébe kerül. Emiatt a cache használatának optimalizálása fontos szerepet játszik a költségek kordában tartásában.

A helyzetet tovább bonyolítja, hogy az Anthropic nem teszi teljesen egyértelművé a csomagok pontos használati limitjeit. A Pro előfizetés például csak annyit ígér, hogy "legalább ötször több használatot biztosít munkamenetenként a díjmentes szolgáltatáshoz képest". A Standard Team csomag pedig "1,25-ször több használatot biztosít munkamenetenként, mint a Pro csomag". Ez a megfogalmazás sok fejlesztő szerint túl homályos, mivel nem ad konkrét számokat a felhasználási keretekről. A gyakorlatban a fejlesztők csak a saját irányítópultjukon látják, mennyi kvótát használtak fel, és ebből próbálják kikövetkeztetni a tényleges korlátokat, főleg azok, akik a Claude Code-ot automatizált rendszerekbe építették be.

Az automatizált munkafolyamatok különösen érzékenyek a kvóták hirtelen kimerülésére. Egy felhasználó figyelmeztetett arra, hogy a hibák gyakran nem egyértelműek. Mint írta: "Azok számára, akik automatizált munkafolyamatokban futtatják a Claude Code-ot, a rate-limit hibákat külön kell kezelni. Ezek általános hibának tűnnek, és csendben újrapróbálkozásokat indítanak. Egyetlen ciklusban futó munkamenet percek alatt el tudja égetni az egész napi költségkeretet."

A mesterséges intelligencia szolgáltatók gyakran arra ösztönzik a fejlesztőket, hogy minden lehetséges folyamatba építsék be az MI rendszereket, akár automatizált fejlesztési munkafolyamatokba is. Ha azonban a kvótarendszer miatt ezek az eszközök váratlanul leállnak, az teljes rendszereket béníthat meg. Az ilyen konfliktusok nem számítanak egyedülállónak az MI szolgáltatások világában. A közelmúltban például a Google Antigravity felhasználói is hasonló problémákra panaszkodtak, amikor váratlanul gyorsan merültek ki a használati keretek.

A mesterséges intelligenciára épülő fejlesztői eszközök piaca még mindig formálódik. A fejlesztők szeretnék kiszámíthatóan kontrollálni a költségeiket, miközben a szolgáltatóknak biztosítaniuk kell, hogy a nagy számítási igényű rendszerek működése gazdaságilag fenntartható legyen. A két fél között egyfajta hallgatólagos tárgyalás zajlik arról, hogy milyen használati és árazási modell tekinthető elfogadhatónak. A következő időszak egyik kulcskérdése az lesz, hogy sikerül-e olyan rendszert kialakítani, amely egyszerre kiszámítható a fejlesztők számára és fenntartható az MI infrastruktúrát működtető vállalatok számára.

Gyorsan kimerülő kvótákra panaszkodnak az Anthropic MI-jét használó fejlesztők

Kapcsolódó cikkek és linkek

Hozzászólások