SG.hu·

Az MI-cégek milliárdokat költenek, de a beszállítók nem tudnak lépést tartani a kapacitásbővítéssel

Az MI-cégek milliárdokat költenek, de a beszállítók nem tudnak lépést tartani a kapacitásbõvítéssel
Az MI-ipar ellátási lánca szűk keresztmetszetbe ütközik, a chip-, memória- és CPU-hiány már az MI fejlődésének tempóját is befolyásolja.

Új őrület söpört végig a Szilícium-völgyön az elmúlt hónapokban. A technológiai szakemberek, akik bizonyítani akarják, hogy az MI-adaptáció élvonalához tartoznak, elkezdtek „tokenmaxxinget” játszani, vagyis versenyezni abban, ki tud több tokent elhasználni. Egy token kb. egy szótagnak felel meg, ezek azok a szövegrészek, amelyeket az MI modellek feldolgoznak. Január és március között az OpenRouter, egy modellhozzáférési piactér által feldolgozott heti tokenmennyiség megnégyszereződött.

De a kiszolgáló iparág egyre nehezebben tudja tartani a lépést az MI iránti kereslet robbanásszerűen növekedésével. Márciusban az Anthropic csúcsidőben korlátozni kezdte eszközei elérését, és azóta előfizetési csomagjain is változtatott, láthatóan a használat visszafogása érdekében. Áprilisban szolgáltatása átlagosan napi 30 perces kimaradásokkal működött. És nincs egyedül. Márciusban az OpenAI hirtelen leállította Sora nevű videógeneráló eszközét, hogy a ritka számítási kapacitást jövedelmezőbb felhasználásokra csoportosítsa át. Április 20-án a Microsoft tulajdonában lévő GitHub leállította új előfizetések fogadását programozó botjához.

Az iparág válasza az lett, hogy egyre nagyobb összegeket önt az infrastruktúrába. Április 20-án az Anthropic több milliárd dolláros partnerséget jelentett be az Amazonnal, amely akár öt gigawatt szerverkapacitást is biztosít, ennek közel ötöde még az év végéig üzembe állhat. Április 24-én közölték, hogy a Google további 40 milliárd dollárral járul hozzá a labor számítási igényeinek kielégítéséhez. Április 27-én az OpenAI bejelentette, hogy átalakítja Microsofttal fennálló partnerségét, hogy minden termékét bármely felhőszolgáltatón keresztül terjeszthesse, így rugalmasabban férhet hozzá a számítási kapacitáshoz.

Az úgynevezett „hiperskálázók”, az Alphabet, Amazon, Meta, Microsoft és Oracle, egyenként több százmilliárd dollárt fektetnek adatközpontokba. Az Alphabet, az Amazon és az Oracle idén már több mint 100 milliárd dollárnyi adósságot vont be. A készpénz felszabadítása érdekében a Meta nemrég bejelentette, hogy leépíti munkaereje 10 százalékát, a Microsoft pedig önkéntes kilépési programot kínál dolgozóinak mintegy 7 százaléka számára. A kapacitásbővítés azonban egyre nehezebbé válik. Az Egyesült Államokban és máshol is nő az adatközpontok építésével szembeni politikai ellenállás. Emellett azok a cégek, amelyek az adatközpontokat felszerelő hardvereket gyártják, a chipektől és hálózati eszközöktől a hűtőrendszerekig, messze nem fektetnek be annyit, hogy lépést tartsanak a kereslettel. A kapacitáshiány így tovább súlyosbodhat.

Kezdjük a politikával. Áprilisban Maine állam törvényhozói megszavaztak egy javaslatot, amely 2027 novemberéig megtiltaná a 20 megawatt feletti adatközpontok építését. Bár a kormányzó később megvétózta, több mint tíz másik amerikai államban is hasonló intézkedések vannak napirenden. Egy becslés szerint tavaly 156 milliárd dollár értékű adatközpont-projektet blokkoltak vagy késleltettek az Egyesült Államokban helyi ellenállás és jogi eljárások miatt. Hasonló visszacsapás tapasztalható Írországtól Brazíliáig. Különösen az energiafaló adatközpontok villamosenergia-számlákra gyakorolt hatása vált széles körben vitatottá, és ez tovább erősödhet, mivel az Öböl-térségben zajló háború emeli az energiaárakat.

Még akkor is, amikor az adatközpontokat jóváhagyják és csatlakoztatják az áramforráshoz, legyen az a hálózat vagy egyre gyakrabban saját energiatermelés, a beruházók nehezen jutnak hozzá a működéshez szükséges számítástechnikai eszközökhöz. Ivan Chiam, a SemiAnalysis kutatócég szakértője szerint egyszerűen nincs elég chip az épülő adatközpontok megtöltéséhez. Gondoljunk az Nvidia grafikus feldolgozó egységeire, amelyek a világ MI számítási kapacitásának több mint kétharmadát adják. A 2022-ben bevezetett H100 GPU bérleti ára november óta körülbelül 30 százalékkal emelkedett, mivel a vevők, akik nem jutnak hozzá az újabb modellekhez, a régebbi generációk felé fordultak. A versenytárs MI processzorok is egyre nehezebben elérhetők. Az Amazon vezére, Andy Jassy áprilisban közölte, hogy vállalata szinte teljesen eladta Trainium 2 MI chipekhez való hozzáférését. A jövőre érkező Trainium 4 kapacitásának jelentős részét már most lefoglalták.


A szűkösség a memóriacsipekre is kiterjed, különösen a nagy sávszélességű memóriára, amelytől az MI modellek erősen függenek. Mindhárom nagy gyártó, az SK Hynix, a Samsung és a Micron is azt állítja, hogy 2026-os kapacitásának nagy része már elkelt. Némi reményt adott márciusban a Google TurboQuant nevű algoritmusa, amely csökkenti az MI memóriaigényét, ami rövid időre visszavetette a memóriagyártók részvényeit. Ennek ellenére a kereslet várhatóan legalább három évig meghaladja a kínálatot.

A hiány most már a merevlemezekre és a központi feldolgozó egységekre is átterjed. Az úgynevezett „ügynöki” MI rendszerek, amelyek terveznek, következtetnek és feladatokat hajtanak végre, sokkal inkább támaszkodnak CPU-kra a munkájuk összehangolásában. A Morgan Stanley becslése szerint ezeknél a rendszereknél egy GPU-ra egy CPU jut, szemben a chatbot rendszerek egy az tizenkettőhöz arányával. A CPU iránti kereslet annyira erős, hogy új életet lehelt az Intelbe, amely nemrég még a hanyatlás szélén állt. Az amerikai chipgyártó piaci értéke az elmúlt hat hónapban több mint a duplájára nőtt.

A probléma lényege, hogy az MI ellátási lánc szereplői jóval kevesebbet fektetnek kapacitásbővítésbe, mint a hiperskálázók. Az 50 legnagyobb chipgyártó, chipgyártó berendezés-gyártó, szerver-, hálózati és hűtőipari vállalat idei tervezett beruházásait megnézve ebben az időszakban a hiperskálázók összesített tőkekiadása 190 százalékkal nőtt, 234 milliárd dollárról 677 milliárdra, míg a beszállítóké mindössze 45 százalékkal, 153 milliárdról 223 milliárdra. Vegyük a TSMC-t, a világ legnagyobb szerződéses chipgyártóját és a csúcskategóriás GPU-k és CPU-k kulcsbeszállítóját. Legfejlettebb gyártóüzemei már most teljes kapacitáson működnek. Vezérigazgatója, C.C. Wei elismerte, hogy a kínálat „nagyon szűk”, ugyanakkor „nincsenek rövidítések”, egy új gyár felépítése két-három évet vesz igénybe. A vállalat 2026-ban mintegy 55 milliárd dollárt tervez költeni, ami 34 százalékos növekedés az előző évhez képest, az elemzők szerint pedig ez 2027-re 65 milliárdra nőhet. A beruházások aránya azonban a bevételhez képest csökkent, a 2022-es körülbelül fele helyett idén már csak egyharmad.

A TSMC óvatossága frusztrálja ügyfeleit. Sam Altman, az OpenAI vezetője arra kérte a vállalatot, hogy „egyszerűen építsenek több kapacitást”. Márciusban Elon Musk, a Tesla és a SpaceX vezetője bejelentette, hogy egy úgynevezett „Terafab” gyárat tervez, amely szerény célként az egész globális félvezetőiparnál több feldolgozási teljesítményt állítana elő évente. A létesítmény, amelynek létrehozásában Musk az Intelt is bevonta, legkorábban 2028-ban kezdhet termelni, és akkor is csak töredékét annak a méretnek, amit elképzeltek. Ráadásul Musk nehezen juthat hozzá a működtetéshez szükséges fejlett gépekhez is, amelyek szintén hiánycikkek.

Ez jól mutatja azt az ellentmondást, amely ma az MI jövőjét jellemzi. A szoftverek fejlesztése hónapok alatt történik, míg az ellátási lánc bővítése évekbe telik. A hardvergyártók viszont nem szívesen építenek túl nagy kapacitást, nehogy kihasználatlanul maradjon. A „tokenmaxxing” őrülete így könnyen rövid életű lehet.

Kapcsolódó cikkek és linkek

Hozzászólások

Jelentkezz be a hozzászóláshoz.

Nem érkezett még hozzászólás. Legyél Te az első!