SG.hu·
Elfogyóban a számítási erő az MI iparban

Az MI vállalatok korlátozzák a szolgáltatásokat és a termékeket, ami sok felhasználót bosszant. A mesterséges intelligencia körüli aranyláz gyorsan kimeríti annak az egyetlen erőforrásnak a kínálatát, amely nélkül az MI fejlesztők nem tudnak működni: a számítási kapacitást. A súlyos hiány komoly aggodalmat váltott ki a nagyfelhasználók körében, vállalatokat kényszerített termékek visszavonására, és megbízhatósági problémákhoz vezetett. Ezek a gondok figyelmeztető jelként szolgálnak az MI fellendülés számára, mivel korlátozhatják az új, nagy teljesítményű MI eszközök hasznosságát éppen akkor, amikor hatalmas felhasználói tömegek kezdték el használni őket a termelékenység növelése érdekében.
Az elmúlt hónapokban robbanásszerűen megnőtt az úgynevezett ügynökszerű MI iránti kereslet. Ezek olyan autonóm eszközök, amelyek a technológiát arra használják, hogy önállóan végezzenek el feladatokat, a szoftverkód írásától kezdve egészen addig, hogy ingatlanközvetítők számára lakásbemutatókat ütemezzenek. A vállalatok versenyt futnak azért, hogy elegendő számítási kapacitást biztosítsanak egyre növekvő ügyfélkörük kiszolgálására, miközben ezek az ügyfelek maguk is jelentősen növelik MI használatukat. "Az emberek mind az olajról beszélnek, de szerintem a világnak valójában főként tokenből van hiánya" - mondta Ben Pouladian, Los Angelesben élő mérnök és technológiai befektető. A token az MI világában egy olyan mérőegység, amely azt jelzi, mennyi számítási erőforrást használ fel egy adott feladat. "Az MI ezen a ponton már nem egyszerűen egy chatbot, amelytől receptet kérünk, miközben a hűtő előtt állunk. Feladatokat szervez, egyre okosabbá válik" - mondta Pouladian.
Mindez egy klasszikus problémára utal, amely a technológiai fellendülések történetében már sokszor felbukkant, a 19. századi vasúti terjeszkedéstől kezdve egészen a 2000-es évek eleji távközlési és internetes robbanásig. A kereslet sokkal gyorsabban nő, mint ahogy a vállalatok képesek erőforrásokhoz jutni és infrastruktúrát kiépíteni. Történelmileg az áremelések jelentették az egyik leggyakoribb megoldást a kínálati hiány kezelésére, ám egy ilyen lépés kockázatos lehet az élvonalbeli MI vállalatok számára, amelyek heves versenyt folytatnak a felhasználók megszerzéséért.
A GPU-k - vagyis azok a mikrochipek, amelyeket az MI modellek betanítására és futtatására használnak - óránkénti bérleti díjai ősz óta meredeken emelkedtek. Az Anthropic, a népszerű Claude chatbot és a vírusgyorsan terjedő Claude Code program készítője az utóbbi időben gyakori szolgáltatáskimaradásokkal küzd. A vállalat csúcsidőben már elkezdte adagolni a felhasználóknak elérhető számítási kapacitást, ám a bevezetést sok panasz kísérte, mert az ügyfelek szerint túl gyorsan elérik a korlátokat. Az OpenAI részben azért állította le a Sora videógeneráló alkalmazás fejlesztését, hogy felszabadítson számítási erőforrásokat olyan kódolási és vállalati termékek számára, amelyek egy új, Spud kódnevű MI modellen működnének.
Az OpenAI API rendszerében - amely egy olyan platform, ahol főként vállalati ügyfelek férnek hozzá a cég szoftveréhez - a tokenhasználat októberben percenként hatmilliárdról március végére percenként 15 milliárdra nőtt. "Rengeteg időt töltök azzal, hogy bármilyen utolsó pillanatban elérhető számítási kapacitást találjak" - mondta Sarah Friar, az OpenAI pénzügyi igazgatója egy befektetővel folytatott nyilvános videóinterjúban. "Jelenleg nagyon kemény döntéseket hozunk arról, milyen dolgokat nem folytatunk, mert egyszerűen nincs elég számítási kapacitásunk."
A tavalyi év vége felé a CoreWeave - az egyik legnagyobb tőzsdén jegyzett MI felhőszolgáltató vállalat - több mint 20 százalékkal emelte árait, és elkezdte arra kérni kisebb ügyfeleit, hogy szemben a korábbi egyéves szerződésekkel legalább három évre kötelezzék el magukat szolgáltatásai mellett. A Bank of America elemzői a múlt hónap végén vételi ajánlással látták el a vállalatot, arra hivatkozva, hogy szolgáltatásai iránti kereslet várhatóan legalább 2029-ig meghaladja majd a kínálatot. Az Nvidia GPU-ihoz, vagyis grafikus feldolgozóegységeihez való hozzáférés piaci árai az utóbbi hónapokban jelentősen emelkedtek a vállalat teljes termékpalettáján. Az Nvidia egyik legfejlettebb, Blackwell generációs chipjének egyórás bérlése az Ornn Compute Price Index adatai szerint jelenleg 4,08 dollárba kerül, ami 48 százalékos emelkedést jelent a két hónappal korábbi 2,75 dollárhoz képest.
"Masszív kapacitáshiánnyal állunk szemben, amilyet az elmúlt több mint öt évben, amióta ezt a vállalkozást vezetem, még soha nem láttam" - mondta J. J. Kardwell, a Vultr felhőinfrastruktúra vállalat vezérigazgatója. "Felmerül a kérdés, miért nem telepítünk egyszerűen több szervert. Azért, mert túl hosszúak az átfutási idők. Az adatközpontok építése sok időt vesz igénybe, és a 2026-ig elérhető elektromos kapacitás már most teljes egészében lekötött." Február közepe óta az Anthropic rendszereiben előforduló szolgáltatáskimaradások annyira gyakorivá váltak, hogy néhány vállalati ügyfél más MI modell szolgáltatókhoz kezdett átállni. David Hsu, a Retool szoftverfejlesztési platform alapítója és vezérigazgatója elmondta, hogy korábban az Anthropic Opus 4.6 modelljét használta cége MI ügynök eszközének működtetéséhez, mert véleménye szerint ez a legjobb modell vállalati felhasználásra. Nemrég azonban az OpenAI modelljére váltott. "Az Anthropic egyszerűen állandóan leáll" - mondta.
Az internet alapvető szolgáltatásainak megbízhatóságát úgynevezett kilencesekben mérik. Négy kilences például 99,99 százalékos rendelkezésre állást jelent, ami egy tipikus érték, amelyet egy szoftvercég ügyfelei számára vállal. Április 8-án az Anthropic Claude API szolgáltatásának rendelkezésre állása az előző 90 napban 98,95 százalék volt. "Ez nem normális" - mondta Amir Haghighat, a Baseten nevű MI inferencia startup társalapítója és technológiai igazgatója. "Gondoljunk csak az AWS-re, az adatbázisokra, az RDS-re vagy a Stripe-ra. Ezeknek rendkívül ellenállónak kell lenniük, nagyon magas rendelkezésre állással. De ez nem az a világ, amelyben jelenleg az MI esetében élünk. Ez nem az a szolgáltatási minőség, amelyet attól a vállalattól szeretnénk kapni, amely az alkalmazásunk intelligenciáját biztosítja."
Az Anthropicnál tapasztalható gyakori leállások éppen akkor történnek, amikor az MI-cég robbanásszerű növekedést él át. 2025 végén a vállalat éves bevételi futási üteme elérte a 9 milliárd dollárt, ami azt jelenti, hogy a cég a következő 12 hónapban ekkora bevétel elérésére számított. Februárra ez az összeg 14 milliárd dollárra nőtt. Két hónappal később pedig megduplázódott, és elérte a 30 milliárd dollárt.
Március végén az Anthropic váratlanul bejelentette, hogy korlátozni fogja a felhasználók által felhasználható tokenek mennyiségét a hétköznapokon a csendes-óceáni idő szerinti reggel 5 és 11 óra közötti csúcsidőszakban. Az ügyfelek a közösségi médiában panaszkodni kezdtek a változás miatt. "Hetek óta nem értem el a Claude Code terminál korlátomat, de ezen a héten körülbelül 45 perc alatt elértem" - írta egy felhasználó az X közösségi oldalon. "Keményen dolgoztunk azon, hogy lépést tartsunk a Claude iránti kereslet növekedésével" - írta az X oldalon Boris Cherny, a Claude Code alkotója és vezetője. "A kapacitás olyan erőforrás, amelyet körültekintően kezelünk, és elsőbbséget adunk azoknak az ügyfeleknek, akik termékeinket és API szolgáltatásunkat használják."
Az elmúlt hónapokban robbanásszerűen megnőtt az úgynevezett ügynökszerű MI iránti kereslet. Ezek olyan autonóm eszközök, amelyek a technológiát arra használják, hogy önállóan végezzenek el feladatokat, a szoftverkód írásától kezdve egészen addig, hogy ingatlanközvetítők számára lakásbemutatókat ütemezzenek. A vállalatok versenyt futnak azért, hogy elegendő számítási kapacitást biztosítsanak egyre növekvő ügyfélkörük kiszolgálására, miközben ezek az ügyfelek maguk is jelentősen növelik MI használatukat. "Az emberek mind az olajról beszélnek, de szerintem a világnak valójában főként tokenből van hiánya" - mondta Ben Pouladian, Los Angelesben élő mérnök és technológiai befektető. A token az MI világában egy olyan mérőegység, amely azt jelzi, mennyi számítási erőforrást használ fel egy adott feladat. "Az MI ezen a ponton már nem egyszerűen egy chatbot, amelytől receptet kérünk, miközben a hűtő előtt állunk. Feladatokat szervez, egyre okosabbá válik" - mondta Pouladian.
Mindez egy klasszikus problémára utal, amely a technológiai fellendülések történetében már sokszor felbukkant, a 19. századi vasúti terjeszkedéstől kezdve egészen a 2000-es évek eleji távközlési és internetes robbanásig. A kereslet sokkal gyorsabban nő, mint ahogy a vállalatok képesek erőforrásokhoz jutni és infrastruktúrát kiépíteni. Történelmileg az áremelések jelentették az egyik leggyakoribb megoldást a kínálati hiány kezelésére, ám egy ilyen lépés kockázatos lehet az élvonalbeli MI vállalatok számára, amelyek heves versenyt folytatnak a felhasználók megszerzéséért.
A GPU-k - vagyis azok a mikrochipek, amelyeket az MI modellek betanítására és futtatására használnak - óránkénti bérleti díjai ősz óta meredeken emelkedtek. Az Anthropic, a népszerű Claude chatbot és a vírusgyorsan terjedő Claude Code program készítője az utóbbi időben gyakori szolgáltatáskimaradásokkal küzd. A vállalat csúcsidőben már elkezdte adagolni a felhasználóknak elérhető számítási kapacitást, ám a bevezetést sok panasz kísérte, mert az ügyfelek szerint túl gyorsan elérik a korlátokat. Az OpenAI részben azért állította le a Sora videógeneráló alkalmazás fejlesztését, hogy felszabadítson számítási erőforrásokat olyan kódolási és vállalati termékek számára, amelyek egy új, Spud kódnevű MI modellen működnének.
Az OpenAI API rendszerében - amely egy olyan platform, ahol főként vállalati ügyfelek férnek hozzá a cég szoftveréhez - a tokenhasználat októberben percenként hatmilliárdról március végére percenként 15 milliárdra nőtt. "Rengeteg időt töltök azzal, hogy bármilyen utolsó pillanatban elérhető számítási kapacitást találjak" - mondta Sarah Friar, az OpenAI pénzügyi igazgatója egy befektetővel folytatott nyilvános videóinterjúban. "Jelenleg nagyon kemény döntéseket hozunk arról, milyen dolgokat nem folytatunk, mert egyszerűen nincs elég számítási kapacitásunk."
A tavalyi év vége felé a CoreWeave - az egyik legnagyobb tőzsdén jegyzett MI felhőszolgáltató vállalat - több mint 20 százalékkal emelte árait, és elkezdte arra kérni kisebb ügyfeleit, hogy szemben a korábbi egyéves szerződésekkel legalább három évre kötelezzék el magukat szolgáltatásai mellett. A Bank of America elemzői a múlt hónap végén vételi ajánlással látták el a vállalatot, arra hivatkozva, hogy szolgáltatásai iránti kereslet várhatóan legalább 2029-ig meghaladja majd a kínálatot. Az Nvidia GPU-ihoz, vagyis grafikus feldolgozóegységeihez való hozzáférés piaci árai az utóbbi hónapokban jelentősen emelkedtek a vállalat teljes termékpalettáján. Az Nvidia egyik legfejlettebb, Blackwell generációs chipjének egyórás bérlése az Ornn Compute Price Index adatai szerint jelenleg 4,08 dollárba kerül, ami 48 százalékos emelkedést jelent a két hónappal korábbi 2,75 dollárhoz képest.
"Masszív kapacitáshiánnyal állunk szemben, amilyet az elmúlt több mint öt évben, amióta ezt a vállalkozást vezetem, még soha nem láttam" - mondta J. J. Kardwell, a Vultr felhőinfrastruktúra vállalat vezérigazgatója. "Felmerül a kérdés, miért nem telepítünk egyszerűen több szervert. Azért, mert túl hosszúak az átfutási idők. Az adatközpontok építése sok időt vesz igénybe, és a 2026-ig elérhető elektromos kapacitás már most teljes egészében lekötött." Február közepe óta az Anthropic rendszereiben előforduló szolgáltatáskimaradások annyira gyakorivá váltak, hogy néhány vállalati ügyfél más MI modell szolgáltatókhoz kezdett átállni. David Hsu, a Retool szoftverfejlesztési platform alapítója és vezérigazgatója elmondta, hogy korábban az Anthropic Opus 4.6 modelljét használta cége MI ügynök eszközének működtetéséhez, mert véleménye szerint ez a legjobb modell vállalati felhasználásra. Nemrég azonban az OpenAI modelljére váltott. "Az Anthropic egyszerűen állandóan leáll" - mondta.
Az internet alapvető szolgáltatásainak megbízhatóságát úgynevezett kilencesekben mérik. Négy kilences például 99,99 százalékos rendelkezésre állást jelent, ami egy tipikus érték, amelyet egy szoftvercég ügyfelei számára vállal. Április 8-án az Anthropic Claude API szolgáltatásának rendelkezésre állása az előző 90 napban 98,95 százalék volt. "Ez nem normális" - mondta Amir Haghighat, a Baseten nevű MI inferencia startup társalapítója és technológiai igazgatója. "Gondoljunk csak az AWS-re, az adatbázisokra, az RDS-re vagy a Stripe-ra. Ezeknek rendkívül ellenállónak kell lenniük, nagyon magas rendelkezésre állással. De ez nem az a világ, amelyben jelenleg az MI esetében élünk. Ez nem az a szolgáltatási minőség, amelyet attól a vállalattól szeretnénk kapni, amely az alkalmazásunk intelligenciáját biztosítja."
Az Anthropicnál tapasztalható gyakori leállások éppen akkor történnek, amikor az MI-cég robbanásszerű növekedést él át. 2025 végén a vállalat éves bevételi futási üteme elérte a 9 milliárd dollárt, ami azt jelenti, hogy a cég a következő 12 hónapban ekkora bevétel elérésére számított. Februárra ez az összeg 14 milliárd dollárra nőtt. Két hónappal később pedig megduplázódott, és elérte a 30 milliárd dollárt.
We’ve been working hard to meet the increase in demand for Claude, and our subscriptions weren't built for the usage patterns of these third-party tools. Capacity is a resource we manage thoughtfully and we are prioritizing our customers using our products and API.
— Boris Cherny (@bcherny) April 3, 2026
Március végén az Anthropic váratlanul bejelentette, hogy korlátozni fogja a felhasználók által felhasználható tokenek mennyiségét a hétköznapokon a csendes-óceáni idő szerinti reggel 5 és 11 óra közötti csúcsidőszakban. Az ügyfelek a közösségi médiában panaszkodni kezdtek a változás miatt. "Hetek óta nem értem el a Claude Code terminál korlátomat, de ezen a héten körülbelül 45 perc alatt elértem" - írta egy felhasználó az X közösségi oldalon. "Keményen dolgoztunk azon, hogy lépést tartsunk a Claude iránti kereslet növekedésével" - írta az X oldalon Boris Cherny, a Claude Code alkotója és vezetője. "A kapacitás olyan erőforrás, amelyet körültekintően kezelünk, és elsőbbséget adunk azoknak az ügyfeleknek, akik termékeinket és API szolgáltatásunkat használják."