SG.hu·
A vállalatok rájöttek, hogy a mesterséges intelligencia nem olcsó játék

A kiadások gyorsabban nőnek a vártnál, ezért a cégek egyre szigorúbban figyelik, hogy mely feladatokhoz szükséges a legfejlettebb mesterséges intelligencia.
Azok a vállalatok, amelyek az elmúlt két évben versenyt futottak azért, hogy minél gyorsabban a dolgozóik kezébe adják a generatív MI eszközöket, most egyre gyakrabban próbálják visszafogni azok használatát. Az ok egyszerű: a mesterséges intelligencia működtetése korántsem olyan olcsó, mint amilyennek sokan gondolták, és a költségek kezdenek komoly terhet jelenteni a vállalati költségvetések számára. A jelenség különösen figyelemre méltó annak fényében, hogy a generatív MI technológiák terjedésének első szakaszában szinte minden nagyvállalat azt hangsúlyozta, hogy az új eszközök forradalmasítják a munkavégzést, növelik a termelékenységet és jelentős versenyelőnyt biztosítanak. Most azonban egyre több cég szembesül azzal, hogy az MI használatának ára gyorsabban növekszik, mint a belőle származó kézzelfogható üzleti haszon.
Az Amazon, a Walmart, a Cisco, az Uber és a Meta egyaránt azok közé a korai alkalmazók közé tartozik, amelyek korlátozásokat vezettek be, igyekeznek visszaszorítani a pazarló használatot, vagy olcsóbb modellek használatára ösztönzik alkalmazottaikat. A cél minden esetben ugyanaz: az MI-vel kapcsolatos kiadások kordában tartása.
A kezdeti időszakban a legtöbb munkavállaló egyszerű chatbotokat használt kérdések megválaszolására, szövegek írására vagy információk összegzésére. Ma azonban egyre több szervezet alkalmaz úgynevezett MI ügynököket, amelyek önállóan képesek összetett feladatok végrehajtására, munkafolyamatok kezelésére vagy akár szoftverfejlesztési feladatok támogatására. Ezek az ügynökök azonban jóval nagyobb számítási kapacitást igényelnek, mint a hagyományos chatbotok. Emiatt a vállalatok kénytelenek feltenni a kérdést: valóban megéri-e minden egyes lekérdezés, automatizált folyamat vagy MI által végzett feladat költsége?
A problémát tovább súlyosbítja, hogy az olyan vezető MI fejlesztők, mint az Anthropic és az OpenAI, fokozatosan eltávolodnak az egyszerű előfizetéses modelltől. Egyre több szolgáltatás esetében token alapú számlázást alkalmaznak, amely a modellek által feldolgozott adatmennyiséget méri. Ez azt jelenti, hogy a vállalatok immár közvetlenül érzékelik minden egyes kérdés, válasz és automatizált munkafolyamat pénzügyi következményét.
Costi Perricos, a Deloitte generatív MI üzletágának globális vezetője szerint a számítási költségek most kezdenek igazán megjelenni a pénzügyi vezetők és igazgatótanácsok gondolkodásában. „A fogyasztókat és a vállalatokat arra szoktatták, hogy a mesterséges intelligencia olcsó vagy ingyenes. Ez azonban egyáltalán nincs így.” Sam Altman, az OpenAI vezérigazgatója szintén arról beszélt nemrég, hogy a költségek az idei év egyik legfontosabb ügyfélproblémájává váltak. „Tavaly ez a kérdés egyszerűen nem merült fel. Az emberek teljesen elégedettek voltak azzal, amennyit költöttek.”
Az egyik leglátványosabb példát az Uber szolgáltatta. Andrew Macdonald, a vállalat elnöke és operatív igazgatója szerint egyre nehezebb igazolni az MI tokenekre fordított kiadásokat. „Nagyon nehéz egyenes vonalat húzni az adatok és aközé, hogy most tényleg 25 százalékkal több hasznos fogyasztói funkciót állítunk elő.” Az Uber ezért használati korlátokat vezetett be. A dolgozók egyéni MI eszközökre fordítható havi tokenkeretét 1500 dollárban maximálták, miután a vállalat már áprilisra elköltötte a teljes, 2026-ra tervezett MI költségvetését.
Hasonló lépésre szánta el magát a Walmart is. Az amerikai kiskereskedelmi óriás saját belső MI ügynökének használatát korlátozta azzal, hogy megszabta, mennyi tokent használhatnak fel az alkalmazottak. Suresh Kumar technológiai vezető szerint a vállalat Code Puppy nevű programozási platformjának használata rendkívüli mértékben megugrott. „Most lehetőségünk van arra, hogy egy lépést hátralépjünk” - mondta, hozzátéve, hogy a munkatársaknak meg kell találniuk az adott feladathoz leginkább megfelelő eszközt.
A Cisco vezetése szerint az MI ügynökök jelentik a következő nagy kihívást. Jeetu Patel, a vállalat termékfejlesztési vezetője rámutatott, hogy egy ügynök működtetése lényegesen nagyobb infrastruktúrát igényel, mint egy hagyományos chatbot. „Az ügynökök működtetéséhez szükséges infrastruktúra mennyisége jelentősen nagyobb, mint egy chatbot esetében. Egyetlen emberre akár 10, 100 vagy agresszív esetben 1000 ügynök is juthat. Ők pedig folyamatosan dolgoznak, ami jelentős számítási kapacitást fogyaszt.”
A Goldman Sachs elemzői szerint az MI ügynökök elterjedése 2030-ra akár huszonnégyszeresére növelheti a tokenfelhasználást. Ez a kereslet pedig tovább súlyosbíthatja a következő 12-18 hónapban várható chiphiányt. Miközben a vállalati MI költések összességében tovább emelkednek, a költségcsökkentési törekvések akár a vezető MI laboratóriumok növekedését is fékezhetik. Ez különösen érzékenyen érintheti az Anthropicot és az OpenAI-t, amelyek az év későbbi részében tőzsdére lépést terveznek, közel ezermilliárd dolláros értékelés mellett.
A piaci versenyt tovább élezi, hogy az év eleje óta a kínai modellek megelőzték amerikai riválisaikat a tokenfogyasztás tekintetében. Az OpenRouter adatai szerint a kínai fejlesztések egyre nagyobb teret nyernek. Ennek egyik oka, hogy Kínában olcsóbb az energia, emellett a helyi fejlesztők számos esetben hatékonyabb modelleket készítettek. Ennek eredményeként a kínai szolgáltatók jóval alacsonyabb tokenárakat tudnak kínálni, ami új előnyt jelent számukra a globális MI versenyben.
A költségek nemcsak az óriáscégeket érintik. A Workato szoftvervállalatnál a 1300 alkalmazott tavaly nyáron kezdett széles körben MI ügynököket használni. Carter Busse informatikai vezető szerint a folyamat robbanásszerű volt. „Úgy terjedt, mint a futótűz. Az emberek valóban elkezdték átalakítani a munkájukat az ügynökök segítségével.” A vállalat azonban kellemetlen meglepetéssel szembesült, amikor az Anthropic májusban átállította szolgáltatásait token alapú elszámolásra. „Az első napon hétszeresére ugrottak a költségeink, és azt mondtam: a fenébe, szörnyet teremtettünk. A nagy nyelvi modelleket fejlesztő cégek eddig gyakorlatilag támogatták a használatunkat, most viszont már nem. A felhasználónkénti árazás megvédett ettől.” A Workato nem korlátozta a hozzáférést, de új irányt vett a belső oktatás. A korábban innovációról szóló képzéseken ma már a költséghatékony használat áll a középpontban. Az alkalmazottakat például arra ösztönzik, hogy lehetőség szerint az Anthropic régebbi, olcsóbb modelljeit használják. „Az innováció helyett beszéljünk inkább az MI pénzügyi felelősségéről.”
A nagy technológiai vállalatok szintén változtatnak a belső ösztönzőrendszereiken. Az Amazon például arra figyelmeztette dolgozóit, hogy ne használják a mesterséges intelligenciát pusztán azért, hogy használják. Egyes mérnökök ugyanis csak azért vetettek be MI ügynököket, hogy jobb helyezést érjenek el a vállalaton belüli ranglistákon. A Meta hasonló intézkedéseket vezetett be tavasszal. Mindkét vállalat saját MI modelleket fejleszt, de számos feladat esetében külső partnerek, például az Anthropic modelljeire és eszközeire is támaszkodik.
Az MI szolgáltatók közben igyekeznek megőrizni ügyfeleiket. Egyre gyakrabban próbálják a felhasználókat rávenni arra, hogy ne minden feladathoz a legdrágább, legnagyobb modelleket használják. Ehelyett olcsóbb alternatívákat ajánlanak, amelyek sok esetben ugyanúgy megfelelnek az adott feladatra. Kyle Daigle, a GitHub operatív igazgatója szerint a Microsoft például már az árazási változtatások előtt egyeztetett ügyfeleivel arról, hogy mely modellek a legalkalmasabbak az egyes munkákhoz. „A felhasználó számára a kérdés az, hogy mely modellek a legjobban megfelelők az adott feladathoz. Nem mindig a legfejlettebb modellre van szükség.”
A Microsoft, az Amazon és a Google már olyan rendszereket is bevezetett, amelyek automatikusan a legmegfelelőbb modellt választják ki egy adott feladat végrehajtásához. Ez segít csökkenteni a felesleges költségeket és hatékonyabban használni a rendelkezésre álló erőforrásokat. Egyes vállalatok más utat választanak. Egyre többen fordulnak a nyílt forráskódú modellek felé, amelyeket saját szervereiken vagy akár helyi számítógépeiken futtathatnak. Ezzel csökkenthető a külső MI szolgáltatóknak és felhőszolgáltatóknak fizetendő összeg.
A vállalatok ugyanakkor továbbra is nehéz egyensúlyozásra kényszerülnek. Egyrészt meg kell fékezniük a gyorsan növekvő MI költségeket, másrészt teljesíteniük kell azokat az ígéreteket, amelyeket a befektetők felé tettek a termelékenység növeléséről és a hatékonyság javításáról. Ahogy a Cisco vezetője fogalmazott: „A mérnökeink több tokent akarnak. Nekünk pedig meg kell találnunk a módját annak, hogyan finanszírozzuk ezt.”
Azok a vállalatok, amelyek az elmúlt két évben versenyt futottak azért, hogy minél gyorsabban a dolgozóik kezébe adják a generatív MI eszközöket, most egyre gyakrabban próbálják visszafogni azok használatát. Az ok egyszerű: a mesterséges intelligencia működtetése korántsem olyan olcsó, mint amilyennek sokan gondolták, és a költségek kezdenek komoly terhet jelenteni a vállalati költségvetések számára. A jelenség különösen figyelemre méltó annak fényében, hogy a generatív MI technológiák terjedésének első szakaszában szinte minden nagyvállalat azt hangsúlyozta, hogy az új eszközök forradalmasítják a munkavégzést, növelik a termelékenységet és jelentős versenyelőnyt biztosítanak. Most azonban egyre több cég szembesül azzal, hogy az MI használatának ára gyorsabban növekszik, mint a belőle származó kézzelfogható üzleti haszon.
Az Amazon, a Walmart, a Cisco, az Uber és a Meta egyaránt azok közé a korai alkalmazók közé tartozik, amelyek korlátozásokat vezettek be, igyekeznek visszaszorítani a pazarló használatot, vagy olcsóbb modellek használatára ösztönzik alkalmazottaikat. A cél minden esetben ugyanaz: az MI-vel kapcsolatos kiadások kordában tartása.
A kezdeti időszakban a legtöbb munkavállaló egyszerű chatbotokat használt kérdések megválaszolására, szövegek írására vagy információk összegzésére. Ma azonban egyre több szervezet alkalmaz úgynevezett MI ügynököket, amelyek önállóan képesek összetett feladatok végrehajtására, munkafolyamatok kezelésére vagy akár szoftverfejlesztési feladatok támogatására. Ezek az ügynökök azonban jóval nagyobb számítási kapacitást igényelnek, mint a hagyományos chatbotok. Emiatt a vállalatok kénytelenek feltenni a kérdést: valóban megéri-e minden egyes lekérdezés, automatizált folyamat vagy MI által végzett feladat költsége?
A problémát tovább súlyosbítja, hogy az olyan vezető MI fejlesztők, mint az Anthropic és az OpenAI, fokozatosan eltávolodnak az egyszerű előfizetéses modelltől. Egyre több szolgáltatás esetében token alapú számlázást alkalmaznak, amely a modellek által feldolgozott adatmennyiséget méri. Ez azt jelenti, hogy a vállalatok immár közvetlenül érzékelik minden egyes kérdés, válasz és automatizált munkafolyamat pénzügyi következményét.
Costi Perricos, a Deloitte generatív MI üzletágának globális vezetője szerint a számítási költségek most kezdenek igazán megjelenni a pénzügyi vezetők és igazgatótanácsok gondolkodásában. „A fogyasztókat és a vállalatokat arra szoktatták, hogy a mesterséges intelligencia olcsó vagy ingyenes. Ez azonban egyáltalán nincs így.” Sam Altman, az OpenAI vezérigazgatója szintén arról beszélt nemrég, hogy a költségek az idei év egyik legfontosabb ügyfélproblémájává váltak. „Tavaly ez a kérdés egyszerűen nem merült fel. Az emberek teljesen elégedettek voltak azzal, amennyit költöttek.”
Az egyik leglátványosabb példát az Uber szolgáltatta. Andrew Macdonald, a vállalat elnöke és operatív igazgatója szerint egyre nehezebb igazolni az MI tokenekre fordított kiadásokat. „Nagyon nehéz egyenes vonalat húzni az adatok és aközé, hogy most tényleg 25 százalékkal több hasznos fogyasztói funkciót állítunk elő.” Az Uber ezért használati korlátokat vezetett be. A dolgozók egyéni MI eszközökre fordítható havi tokenkeretét 1500 dollárban maximálták, miután a vállalat már áprilisra elköltötte a teljes, 2026-ra tervezett MI költségvetését.
Hasonló lépésre szánta el magát a Walmart is. Az amerikai kiskereskedelmi óriás saját belső MI ügynökének használatát korlátozta azzal, hogy megszabta, mennyi tokent használhatnak fel az alkalmazottak. Suresh Kumar technológiai vezető szerint a vállalat Code Puppy nevű programozási platformjának használata rendkívüli mértékben megugrott. „Most lehetőségünk van arra, hogy egy lépést hátralépjünk” - mondta, hozzátéve, hogy a munkatársaknak meg kell találniuk az adott feladathoz leginkább megfelelő eszközt.
A Cisco vezetése szerint az MI ügynökök jelentik a következő nagy kihívást. Jeetu Patel, a vállalat termékfejlesztési vezetője rámutatott, hogy egy ügynök működtetése lényegesen nagyobb infrastruktúrát igényel, mint egy hagyományos chatbot. „Az ügynökök működtetéséhez szükséges infrastruktúra mennyisége jelentősen nagyobb, mint egy chatbot esetében. Egyetlen emberre akár 10, 100 vagy agresszív esetben 1000 ügynök is juthat. Ők pedig folyamatosan dolgoznak, ami jelentős számítási kapacitást fogyaszt.”
A Goldman Sachs elemzői szerint az MI ügynökök elterjedése 2030-ra akár huszonnégyszeresére növelheti a tokenfelhasználást. Ez a kereslet pedig tovább súlyosbíthatja a következő 12-18 hónapban várható chiphiányt. Miközben a vállalati MI költések összességében tovább emelkednek, a költségcsökkentési törekvések akár a vezető MI laboratóriumok növekedését is fékezhetik. Ez különösen érzékenyen érintheti az Anthropicot és az OpenAI-t, amelyek az év későbbi részében tőzsdére lépést terveznek, közel ezermilliárd dolláros értékelés mellett.
A piaci versenyt tovább élezi, hogy az év eleje óta a kínai modellek megelőzték amerikai riválisaikat a tokenfogyasztás tekintetében. Az OpenRouter adatai szerint a kínai fejlesztések egyre nagyobb teret nyernek. Ennek egyik oka, hogy Kínában olcsóbb az energia, emellett a helyi fejlesztők számos esetben hatékonyabb modelleket készítettek. Ennek eredményeként a kínai szolgáltatók jóval alacsonyabb tokenárakat tudnak kínálni, ami új előnyt jelent számukra a globális MI versenyben.
A költségek nemcsak az óriáscégeket érintik. A Workato szoftvervállalatnál a 1300 alkalmazott tavaly nyáron kezdett széles körben MI ügynököket használni. Carter Busse informatikai vezető szerint a folyamat robbanásszerű volt. „Úgy terjedt, mint a futótűz. Az emberek valóban elkezdték átalakítani a munkájukat az ügynökök segítségével.” A vállalat azonban kellemetlen meglepetéssel szembesült, amikor az Anthropic májusban átállította szolgáltatásait token alapú elszámolásra. „Az első napon hétszeresére ugrottak a költségeink, és azt mondtam: a fenébe, szörnyet teremtettünk. A nagy nyelvi modelleket fejlesztő cégek eddig gyakorlatilag támogatták a használatunkat, most viszont már nem. A felhasználónkénti árazás megvédett ettől.” A Workato nem korlátozta a hozzáférést, de új irányt vett a belső oktatás. A korábban innovációról szóló képzéseken ma már a költséghatékony használat áll a középpontban. Az alkalmazottakat például arra ösztönzik, hogy lehetőség szerint az Anthropic régebbi, olcsóbb modelljeit használják. „Az innováció helyett beszéljünk inkább az MI pénzügyi felelősségéről.”
A nagy technológiai vállalatok szintén változtatnak a belső ösztönzőrendszereiken. Az Amazon például arra figyelmeztette dolgozóit, hogy ne használják a mesterséges intelligenciát pusztán azért, hogy használják. Egyes mérnökök ugyanis csak azért vetettek be MI ügynököket, hogy jobb helyezést érjenek el a vállalaton belüli ranglistákon. A Meta hasonló intézkedéseket vezetett be tavasszal. Mindkét vállalat saját MI modelleket fejleszt, de számos feladat esetében külső partnerek, például az Anthropic modelljeire és eszközeire is támaszkodik.
Az MI szolgáltatók közben igyekeznek megőrizni ügyfeleiket. Egyre gyakrabban próbálják a felhasználókat rávenni arra, hogy ne minden feladathoz a legdrágább, legnagyobb modelleket használják. Ehelyett olcsóbb alternatívákat ajánlanak, amelyek sok esetben ugyanúgy megfelelnek az adott feladatra. Kyle Daigle, a GitHub operatív igazgatója szerint a Microsoft például már az árazási változtatások előtt egyeztetett ügyfeleivel arról, hogy mely modellek a legalkalmasabbak az egyes munkákhoz. „A felhasználó számára a kérdés az, hogy mely modellek a legjobban megfelelők az adott feladathoz. Nem mindig a legfejlettebb modellre van szükség.”
A Microsoft, az Amazon és a Google már olyan rendszereket is bevezetett, amelyek automatikusan a legmegfelelőbb modellt választják ki egy adott feladat végrehajtásához. Ez segít csökkenteni a felesleges költségeket és hatékonyabban használni a rendelkezésre álló erőforrásokat. Egyes vállalatok más utat választanak. Egyre többen fordulnak a nyílt forráskódú modellek felé, amelyeket saját szervereiken vagy akár helyi számítógépeiken futtathatnak. Ezzel csökkenthető a külső MI szolgáltatóknak és felhőszolgáltatóknak fizetendő összeg.
A vállalatok ugyanakkor továbbra is nehéz egyensúlyozásra kényszerülnek. Egyrészt meg kell fékezniük a gyorsan növekvő MI költségeket, másrészt teljesíteniük kell azokat az ígéreteket, amelyeket a befektetők felé tettek a termelékenység növeléséről és a hatékonyság javításáról. Ahogy a Cisco vezetője fogalmazott: „A mérnökeink több tokent akarnak. Nekünk pedig meg kell találnunk a módját annak, hogyan finanszírozzuk ezt.”