SG.hu

A Meta megkezdte első saját MI-tréning chipjének tesztelését

A Facebook tulajdonosa, a Meta már teszteli első, a mesterséges intelligencia rendszerek képzésére szánt saját fejlesztésű chipjét. Ez kulcsfontosságú mérföldkő, mivel a cég egyre kevésbé akar külső beszállítókra támaszkodni, mint például az Nvidia. A világ legnagyobb közösségi médiavállalata megkezdte a chip telepítését, és azt tervezi, hogy ha a tesztelés jól megy, felpörgeti a gyártást a széles körű használatra.

A saját chipek fejlesztésének erőltetése része a Meta azon hosszú távú tervének, hogy csökkentse gigantikus infrastrukturális költségeit, mivel a vállalat rengeteget költ az MI-eszközökre a növekedés előmozdítása érdekében. A Meta - amely az Instagram és a WhatsApp tulajdonosa is - 2025-re 114-119 milliárd dolláros összkiadást prognosztizált, amely akár 65 milliárd dollárnyi tőkeköltséget is tartalmazhat, amelyet nagyrészt az MI-infrastruktúrára fordított kiadások hajtanak. A Meta új oktatóchipje egy dedikált gyorsító, vagyis kizárólag MI-specifikus feladatok megoldására tervezték. Ezáltal energiatakarékosabb lehet, mint az ilyen munkaterhelésekhez általában használt integrált grafikus feldolgozóegységek (GPU-k).

A Meta a tajvani székhelyű TSMC chipgyártóval dolgozik együtt a chip előállításán. A tesztüzem azután kezdődött, hogy a Meta befejezte a chip első „tape-out”-ját, ami a szilícium fejlesztési munkák sikerének egyik jelentős jele, amely magában foglalja a kezdeti terv chipgyáron való átküldését. Egy tipikus tape-out több tízmillió dollárba kerül, és nagyjából három-hat hónapig tart, és nincs garancia arra, hogy a teszt sikerülni fog. A kudarc esetén a Meta-nak diagnosztizálnia kell a problémát, és meg kell ismételnie a tape-out lépést.

A chip a vállalat Meta Training and Inference Accelerator (MTIA) sorozatának legújabb tagja. A program évek óta húzódik, egy alkalommal a fejlesztés hasonló fázisában lévő chipet már selejteztek. A Meta azonban tavaly elkezdett egy MTIA chipet használni a következtetés elvégzésére, vagyis arra a folyamatra, amely egy mesterséges intelligencia rendszer futtatásával jár, miközben a felhasználók interakcióba lépnek vele. Az ajánlórendszernél vetették be, ezek határozzák meg, hogy mely tartalmak jelenjenek meg a Facebook és az Instagram hírfolyamában.

A Meta vezetői elmondták, hogy 2026-ra szeretnék elkezdeni saját chipjeik használatát a képzéshez, vagyis ahhoz a számításigényes folyamathoz, amelynek során az MI-rendszert adathalmazokkal táplálják, hogy „megtanulja”, hogyan kell teljesítenie. A következtető chiphez hasonlóan a cél a tréning chip esetében is az, hogy az ajánlórendszerekkel kezdjék, és később olyan generatív MI termékekhez használják, mint egy chatbot. „Azon dolgozunk, hogy elvégezzük az ajánlórendszerek képzését, majd végül gondolkodunk a képzésről és a következtetésről a mesterséges intelligencia számára” - mondta Chris Cox, a Meta termékigazgatója a Morgan Stanley múlt heti technológiai, média és távközlési konferenciáján. Cox a Meta chipfejlesztési erőfeszítéseit egyelőre egy iteratív kísérletezési helyzetnek nevezte, de elmondta, hogy a vezetők „nagy sikernek” tekintik az ajánlásokhoz használt első generációs következtető chipet.

A Meta korábban már leállított egy saját fejlesztésű, egyedi következtető chipet, miután az megbukott egy kisléptékű tesztüzemben, hasonlóan ahhoz, amit most a képzési chip esetében végez, és inkább 2022-ben több milliárd dollár értékben rendelt Nvidia GPU-kat. A közösségi médiavállalat azóta is az Nvidia egyik legnagyobb ügyfele maradt, és GPU-k özönét halmozta fel a modelljei betanításához, többek között az ajánlások és hirdetések rendszereihez és a Llama alapmodell-sorozatához. Az egységek következtetést is végeznek annak a több mint 3 milliárd embernek, akik naponta használják az alkalmazásait. Ezeknek a GPU-knak az értéke idén megkérdőjeleződött, mivel az MI-kutatók egyre inkább kétségbe vonják, hogy mennyi előrelépés érhető el a nagy nyelvi modellek folyamatos „skálázásával”, egyre több adat és számítási teljesítmény hozzáadásával.

Ezeket a kételyeket erősítette a kínai DeepSeek startup cég január végén bemutatott új, olcsó modellje, amelyek a legtöbb piacon lévő modellnél nagyobb mértékben a következtetésekre támaszkodva optimalizálják a számítási hatékonyságot. A DeepSeek által kiváltott globális hullámvölgyben az Nvidia részvényei egy ponton értékük egyötödét is elvesztették. Ezt követően volt egy komoly visszapattanás, mivel a befektetők arra fogadnak, hogy a vállalat chipjei maradnak a képzés és következtetés iparági szabványai.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
Nem érkezett még hozzászólás. Legyél Te az első!