SG.hu
Egy petaflop teljesítmény az asztalon
Az Nvidia bemutatta asztali mesterséges intelligencia szuperszámítógépét. A 1 petaflop teljesítményű DGX Spark rendszer 200 milliárd paraméterrel rendelkező mesterséges intelligencia modelleket futtat helyileg 4000 dollárért.
Az Nvidia bejelentette, hogy megkezdi a megrendelések felvételét a DGX Spark-ra, mely egy 4000 dollárba kerülő asztali mesterséges intelligencia számítógép. 1 petaflop számítási teljesítményt és 128 GB egységes memóriát tartalmaz egy olyan formában, amely elég kicsi ahhoz, hogy elférjen egy asztalon. A legnagyobb előnye valószínűleg a nagy integrált memóriája, amely nagyobb mesterséges intelligencia modelleket futtathat, mint a fogyasztói GPU-k. A DGX Sparkot a cég januárban „Project DIGITS” néven mutatta be, és májusban adott neki hivatalos nevet. Ez az Nvidia nagy kísérlete egy új kategóriájú asztali számítógépes munkaállomás létrehozására, kifejezetten MI-fejlesztés céljára.
A Sparkkal az Nvidia azon MI-fejlesztők problémáját kívánja megoldani, akiknél az MI-feladat meghaladja a standard PC-k és munkaállomások memóriájának és szoftveres képességeinek határait, ami arra kényszeríti őket, hogy munkájukat felhőszolgáltatásokra vagy adatközpontokra helyezzék át. Az asztali MI-munkaállomások tényleges piacának mérete azonban nagyon bizonytalan, különösen figyelembe véve az előzetes költségeket a felhőalapú alternatívákkal szemben, amelyek lehetővé teszik a fejlesztők számára, hogy használatuk arányában fizessenek.
A Nvidia Spark elegendő memóriával rendelkezik ahhoz, hogy a szokásosnál nagyobb MI modelleket futtasson helyi feladatokhoz, akár 200 milliárd paraméterrel, és finomhangoljon akár 70 milliárd paramétert tartalmazó modelleket anélkül, hogy távoli infrastruktúrára lenne szükség. A lehetséges felhasználási területek között szerepelnek a nagyobb, nyitott súlyú nyelvi modellek és a médiaszintézis modellek, például az MI képgenerátorok futtatása. Az Nvidia szerint a felhasználók testreszabhatják a Black Forest Labs Flux.1 modelljeit képgeneráláshoz, építhetnek látásalapú kereső- és összefoglaló ügynököket az Nvidia Cosmos Reason látásalapú nyelvi modelljével, vagy létrehozhatnak csevegőrobotokat a DGX Spark platformra optimalizált Qwen3 modellel.
Az Nvidia sok mindent pakolt az 1,2 kilós, 150 x 150 x 50 milliméteres 240 watt teljesítményű dobozba. A rendszer az Nvidia GB10 Grace Blackwell Superchip processzorán fut, ConnectX-7 200 Gb/s hálózati kapcsolattal rendelkezik, és NVLink-C2C technológiát használ, amely ötször akkora sávszélességet biztosít, mint a PCIe Gen 5. Emellett tartalmazza a már említett 128 GB-os egységes memóriát, amelyet a rendszer és a GPU feladatok megosztanak egymás között. Az operációs rendszer tekintetében a Spark egy ARM-alapú rendszer, amely az Nvidia DGX OS-t futtatja, egy Ubuntu Linux-alapú operációs rendszert, amelyet kifejezetten GPU-feldolgozáshoz fejlesztettek ki. Előre telepítve van rá az Nvidia MI szoftvercsomagja, beleértve a CUDA könyvtárakat és a vállalat NIM mikroszolgáltatásait.
A DGX Spark ára 3999 dollártól kezdődik. Ez soknak tűnhet, de ha figyelembe vesszük a nagy teljesítményű GPU-k, például az RTX Pro 6000 (kb. 9000 dollár) vagy az MI szerver GPU-k (például 25 000 dollár egy alapszintű H100) árait, akkor a DGX Spark összességében sokkal olcsóbb választásnak tűnik, bár teljesítménye közel sem olyan nagy. A GB10 chip GPU-számítási teljesítménye nagyjából megegyezik az RTX 5070-ével, annak azonban csak 12 GB a videomemóriája, ami korlátozza az ilyen rendszeren futtatható MI-modellek méretét. 128 GB egységes memóriával a DGX Spark sokkal nagyobb modelleket tud futtatni, bár lassabb sebességgel, mint például egy RTX 5090 (amely általában 24 GB RAM-mal kerül forgalomba). Például az OpenAI legújabb gpt-oss nyelvi modelljének 120 milliárd paraméterrel rendelkező nagyobb verziójának futtatásához körülbelül 80 GB memóriára van szükség, ami messze meghaladja a fogyasztói GPU-kban elérhető memóriamennyiséget.
Jensen Huang, az Nvidia alapítója és vezérigazgatója a DGX Spark piacra dobásának alkalmából személyesen szállította le az első egységek egyikét Elon Musknak a SpaceX texasi Starbase létesítményébe, megismételve egy hasonló szállítást, amelyet Huang 2016-ban végzett Musknak az OpenAI-nál. "2016-ban megépítettük a DGX-1-et, hogy az MI-kutatók saját szuperszámítógéppel rendelkezzenek. Az első rendszert személyesen vittem el Elonnak egy OpenAI nevű kis startuphoz, és ebből született meg a ChatGPT” - mondta Huang. "A DGX-1 indította el az MI-szuperszámítógépek korszakát, és feltárta a modern MI-t hajtó skálázási törvényeket. A DGX Sparkkal visszatérünk ehhez a küldetéshez.”
Az Nvidia bejelentette, hogy megkezdi a megrendelések felvételét a DGX Spark-ra, mely egy 4000 dollárba kerülő asztali mesterséges intelligencia számítógép. 1 petaflop számítási teljesítményt és 128 GB egységes memóriát tartalmaz egy olyan formában, amely elég kicsi ahhoz, hogy elférjen egy asztalon. A legnagyobb előnye valószínűleg a nagy integrált memóriája, amely nagyobb mesterséges intelligencia modelleket futtathat, mint a fogyasztói GPU-k. A DGX Sparkot a cég januárban „Project DIGITS” néven mutatta be, és májusban adott neki hivatalos nevet. Ez az Nvidia nagy kísérlete egy új kategóriájú asztali számítógépes munkaállomás létrehozására, kifejezetten MI-fejlesztés céljára.
A Sparkkal az Nvidia azon MI-fejlesztők problémáját kívánja megoldani, akiknél az MI-feladat meghaladja a standard PC-k és munkaállomások memóriájának és szoftveres képességeinek határait, ami arra kényszeríti őket, hogy munkájukat felhőszolgáltatásokra vagy adatközpontokra helyezzék át. Az asztali MI-munkaállomások tényleges piacának mérete azonban nagyon bizonytalan, különösen figyelembe véve az előzetes költségeket a felhőalapú alternatívákkal szemben, amelyek lehetővé teszik a fejlesztők számára, hogy használatuk arányában fizessenek.
A Nvidia Spark elegendő memóriával rendelkezik ahhoz, hogy a szokásosnál nagyobb MI modelleket futtasson helyi feladatokhoz, akár 200 milliárd paraméterrel, és finomhangoljon akár 70 milliárd paramétert tartalmazó modelleket anélkül, hogy távoli infrastruktúrára lenne szükség. A lehetséges felhasználási területek között szerepelnek a nagyobb, nyitott súlyú nyelvi modellek és a médiaszintézis modellek, például az MI képgenerátorok futtatása. Az Nvidia szerint a felhasználók testreszabhatják a Black Forest Labs Flux.1 modelljeit képgeneráláshoz, építhetnek látásalapú kereső- és összefoglaló ügynököket az Nvidia Cosmos Reason látásalapú nyelvi modelljével, vagy létrehozhatnak csevegőrobotokat a DGX Spark platformra optimalizált Qwen3 modellel.
Az Nvidia sok mindent pakolt az 1,2 kilós, 150 x 150 x 50 milliméteres 240 watt teljesítményű dobozba. A rendszer az Nvidia GB10 Grace Blackwell Superchip processzorán fut, ConnectX-7 200 Gb/s hálózati kapcsolattal rendelkezik, és NVLink-C2C technológiát használ, amely ötször akkora sávszélességet biztosít, mint a PCIe Gen 5. Emellett tartalmazza a már említett 128 GB-os egységes memóriát, amelyet a rendszer és a GPU feladatok megosztanak egymás között. Az operációs rendszer tekintetében a Spark egy ARM-alapú rendszer, amely az Nvidia DGX OS-t futtatja, egy Ubuntu Linux-alapú operációs rendszert, amelyet kifejezetten GPU-feldolgozáshoz fejlesztettek ki. Előre telepítve van rá az Nvidia MI szoftvercsomagja, beleértve a CUDA könyvtárakat és a vállalat NIM mikroszolgáltatásait.
A DGX Spark ára 3999 dollártól kezdődik. Ez soknak tűnhet, de ha figyelembe vesszük a nagy teljesítményű GPU-k, például az RTX Pro 6000 (kb. 9000 dollár) vagy az MI szerver GPU-k (például 25 000 dollár egy alapszintű H100) árait, akkor a DGX Spark összességében sokkal olcsóbb választásnak tűnik, bár teljesítménye közel sem olyan nagy. A GB10 chip GPU-számítási teljesítménye nagyjából megegyezik az RTX 5070-ével, annak azonban csak 12 GB a videomemóriája, ami korlátozza az ilyen rendszeren futtatható MI-modellek méretét. 128 GB egységes memóriával a DGX Spark sokkal nagyobb modelleket tud futtatni, bár lassabb sebességgel, mint például egy RTX 5090 (amely általában 24 GB RAM-mal kerül forgalomba). Például az OpenAI legújabb gpt-oss nyelvi modelljének 120 milliárd paraméterrel rendelkező nagyobb verziójának futtatásához körülbelül 80 GB memóriára van szükség, ami messze meghaladja a fogyasztói GPU-kban elérhető memóriamennyiséget.
Jensen Huang, az Nvidia alapítója és vezérigazgatója a DGX Spark piacra dobásának alkalmából személyesen szállította le az első egységek egyikét Elon Musknak a SpaceX texasi Starbase létesítményébe, megismételve egy hasonló szállítást, amelyet Huang 2016-ban végzett Musknak az OpenAI-nál. "2016-ban megépítettük a DGX-1-et, hogy az MI-kutatók saját szuperszámítógéppel rendelkezzenek. Az első rendszert személyesen vittem el Elonnak egy OpenAI nevű kis startuphoz, és ebből született meg a ChatGPT” - mondta Huang. "A DGX-1 indította el az MI-szuperszámítógépek korszakát, és feltárta a modern MI-t hajtó skálázási törvényeket. A DGX Sparkkal visszatérünk ehhez a küldetéshez.”