Gyurkity Péter

Új szuper­számító­gép­pel vág vissza a NEC

A NEC újabb fejlesztéssel egészítette ki SX-sorozatát, amelynek segítségével reményeik szerint eséllyel szállhatnak szembe az IBM áradatával és a Cray ismétlődő szárnypróbálgatásaival.

A legújabb családtag az SX-9, amelyet első alkalommal a novemberi iExpo2007 kiállításon mutatnak majd be a nagyközönség előtt. Japánban csak ezt követően bukkan majd fel az új szuperszámítógép, amely azonban már most megrendelhető a vállalattól. Abban reménykednek, hogy a teljesítményt felturbózásával javulnak esélyeik az üzleti szegmensben.


Az SX-9 teljesítményplafonja processzormagonként egészen pontosan 102,4 gigaflops, node-onként 1,6 teraflops, teljes kiszerelésben pedig állításuk szerint 839 teraflops. Ez igen jó eredmény, hiszen az IBM maga is az 1 petaflops álomhatárt döntögeti Roadrunner projektje révén. Az SX-8-hoz képest mindenképpen nagy előrelépés, hiszen a NEC adatai szerint az új példány 13-szor gyorsabb és az energiafelhasználást tekintve is kedvezőbb mutatókkal bír. Mindez az árán is meglátszik - a havi bérleti díj 26 ezer dollár, ami nyilván csak a nagyobb cégeknek, kutatóközpontoknak és intézményeknek éri meg.

A NEC egyébként eddig összesen mintegy ezer példányt adott el az SX-sorozatból. Az SX-9 reményeik szerint ezen a téren is jól teljesít majd és 2010-ig, vagyis az elkövetkező két évben 700 darabon adnak majd túl. Az első számú célközönség természetesen azon intézmények aránylag szűk csoportja, amelyek különböző bonyolult szimulációkon dolgoznak, a fegyverrendszerektől kezdve a meteorológián át az orvostudományig.

Az SX-9 részletes leírása megtalálható a cég weboldalán, képekkel és táblázatokkal kiegészítve.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • dez #27
    "a kettő együtt is megy" -> összetettség, bonyolultabb shaderek + gyorsaság
  • dez #26
    "Dx9 alatt is lehet dx6-os stilusban programozni. Ettol viszont a jatek meg elavult technikat fog hasznalni. Ez kb. olyan mint dx9 alatt cpu-val szamolni a vertex forgatasokat, amiket mar a gf1-es is kezelt."
    Van itt egy nagy különbség: ha a T&L engine-t nem használtad ki, nem lett gyorsabb a chip többi része. Viszont most a GS használata máshonnan (VS, PS) vonja el a teljesítményt. Szóval - egyelőre - egyszerűen nem éri meg használni, és ott hagyni parlagon a proci kihasználatlan magjait.

    "Ha nem tudsz valamire valaszolni, akkor mindig azt mondod, hogy nincs hozza kedved. Ehhez kepest eleg sokat beszelsz..."
    Ez jó volt. :) Viszont nem szeretek feleselgesen beszélni. Nos arról van szó, hogy - többek között - a GPU-k fejlesztésében a fő szempont a teljesítmény-hatékonyság. Nem lett volna értelme korábban olyan bonyolult GPU-kat lérehozni, amik jó bonyolult műveleteket tudnak, viszont csak lassan. Ma ért el oda a technika, hogy a kettő együtt is megy.

    "En nem szoktam belekotni a helyesirasba. Szerintem a lenyeg hogy megertse az akinek szanjuk a szoveget. Ha te nem erted, akkor gyakorold a szovegertest."
    Ez nem helyesírási kérdés, hanem két mértékegység keverése. Rossz gyakorlat. Most egyértelmű volt, mire gondolsz, más esetekben meg nem lesz az.

    "Lehet, de nekem ez a velemenyem. Az algoritmusok fejlodnek, a technika fejlodik, de ez a vektorgrafika meg mindig ugyanaz a vektorgrafika ami volt, es a hardverek sem tudnak semmi olyat amit mar korabban ne lattunk volna. Csak olcsobbak es gyorsabbak lettek."
    Hát, nem tudom, hogy a régi nem-PC-s grafikus kártyák tudtak-e megfelelő sebességgel shaderkódokat futtatni... De akár tudtak, akár nem, az első egy chipre integrált 3D gyorsítók nem tudtak ilyet. A maiak meg már tudnak. Ráadásul nem csak egyre gyorsabban, hanem egyre rugalmasabban.

    "ps: 5-en Peter Hofstee tart eloadast a cell-rol. Jossz? Engem pl. erdekel hogy hogyan erdemes egy nagy cellaszamu aramkort (cnnd chipet) feltetelezo kodot a cell-re portolni."
    Valószínű megyek.
  • kvp #25
    "A DX9-es cuccokat (kártyák és programok) már nevezhetjük elavultnak. De az olyan játékokat, amik bár DX10-esek, de nem használják ki fullosan fizikára és egyébre a Geomerty Shadert, hát ez egy kissé átgondolatlan kijelentés."

    Dx9 alatt is lehet dx6-os stilusban programozni. Ettol viszont a jatek meg elavult technikat fog hasznalni. Ez kb. olyan mint dx9 alatt cpu-val szamolni a vertex forgatasokat, amiket mar a gf1-es is kezelt.

    ""az ibm pga kartyaja"
    Jaj, most itt fel lehetne hozni sok más hasonló rendszert is, de értelmetlen lenne. Ha nem érted magadtól, miért, inkább nem is erőlködöm az elmagyarázással."

    Ha nem tudsz valamire valaszolni, akkor mindig azt mondod, hogy nincs hozza kedved. Ehhez kepest eleg sokat beszelsz...

    ""A 320Kb memoriaja nem tunik soknak, de akkoriban csak a legnagyobb pc-kben volt 640Kb."Még mindig nem tudod, hogy a kis b a bit jele?"

    En nem szoktam belekotni a helyesirasba. Szerintem a lenyeg hogy megertse az akinek szanjuk a szoveget. Ha te nem erted, akkor gyakorold a szovegertest.

    ""Mit fejlodtunk? Tobb es gyorsabb processzor van egy gf8800-asban. Nagyobb a felhasznalhato memoria. Jobbak az alogritmusok es tobb van beloluk. Es... igen kb. ennyi. Az alapelv ugyanaz es a mukodes is."
    Ez is egy nagyon elnagyolt és átgondolatlan kijelentés."

    Lehet, de nekem ez a velemenyem. Az algoritmusok fejlodnek, a technika fejlodik, de ez a vektorgrafika meg mindig ugyanaz a vektorgrafika ami volt, es a hardverek sem tudnak semmi olyat amit mar korabban ne lattunk volna. Csak olcsobbak es gyorsabbak lettek.

    ps: 5-en Peter Hofstee tart eloadast a cell-rol. Jossz? Engem pl. erdekel hogy hogyan erdemes egy nagy cellaszamu aramkort (cnnd chipet) feltetelezo kodot a cell-re portolni.
  • dez #24
    A DX9-es cuccokat (kártyák és programok) már nevezhetjük elavultnak. De az olyan játékokat, amik bár DX10-esek, de nem használják ki fullosan fizikára és egyébre a Geomerty Shadert, hát ez egy kissé átgondolatlan kijelentés. 1. Még legalább fél, de inkább egy évig a kijövő játékok nem fogják ezt tenni. 2. Még egy 8800 Ultra is kevés ahhoz, hogy a szokásos grafikai műveletek mellett az számolja az összes vertexes műveletet, és még a fizikát is, miközben a gépben lévő pl. 4 magos proci szinte csak malmozik.

    "az ibm pga kartyaja"
    Jaj, most itt fel lehetne hozni sok más hasonló rendszert is, de értelmetlen lenne. Ha nem érted magadtól, miért, inkább nem is erőlködöm az elmagyarázással.

    "A 320Kb memoriaja nem tunik soknak, de akkoriban csak a legnagyobb pc-kben volt 640Kb."
    Még mindig nem tudod, hogy a kis b a bit jele?

    "Mit fejlodtunk? Tobb es gyorsabb processzor van egy gf8800-asban. Nagyobb a felhasznalhato memoria. Jobbak az alogritmusok es tobb van beloluk. Es... igen kb. ennyi. Az alapelv ugyanaz es a mukodes is."
    Ez is egy nagyon elnagyolt és átgondolatlan kijelentés.
  • kvp #23
    ""Csak az elavult rendszereken szamolja a fizikat es az animaciokat a proci."
    Butaság. Ha nincs Physix kártyád (+ támogatás a játékban), vagy 2.-3. GPU-d Havok FX-re (+ támogatás a játékban), akkor szerinted mi számolja a fizikát? Egy kismanó? (A Havok FX amúgy is csak egyes nem-interaktív effekteket számol, fullosabb fizikát nem.)
    Geomerty Shader nélkül ugyancsak a proci számolja az animációkat."

    Igen, ezek az elavult directx 10-et vagy opengl 2.0-at nem tamogato jatekok. A jelenlegi engine-ek kozott azert mar van olyan ami kepes 1 db dx9-es kartyan futtatni a fizikat es a grafikat is, sajnos megfelezve ezzel a framerate-et. Viszont a megoldas mukodik, a dx10 ket elonye a szep szabvanyos interface es a geometry shaderek kotelezove tetele.

    "2. A Vertex Shader önmagában nem tud új poligonokat generálni, erre csak a DX10-zel megjelent Geometry Shader képes. Ezen kívül az R8500 és későbbi ATI GPU-kban lévő TrueForm engine tud ilyet, tesszeláció keretében."

    Tudna, ugyanis az opengl szabvanyban mar az 1.1-tol benne volt az akkor meg nehezkes feedback buffer, csak a szoftvertamogatas valamikor a gf1 es gf2 kozott kikerult a driverekbol. Most a dx10 miatt kotelezo lesz visszatenni. Itt volt az ideje.

    "Majd akkor fognak erre jobban rászállni, ha a piacon erős többségben lesznek a DX10-es kártyák, azok közül is a használható teljesítményűek..."

    Van olyan jatek ami kozel 10 eves, eredetileg voodoo-kra keszult es tamogatta a hardveres fizika gyorsitast (pl. profi 3dfx kartyakon amikben valojaban rendes cpu-k vannak). Egyebkent szamomra a modern technologia a geometry shader-tol kezdodik. Amelyik jatek nem hasznalja, az csak egy szepen feldiszitett, de alapvetoen elavult engine. Az elso nvidia kartyak meg tudtak, a rivak mar csak opengl alatt es csak szoftverbol, a legtobb modern gf pedig nem tamogatta. A gf8800-as sorozat az elso tenyleges fejlodest felmutato videokartya a gf1-es sorozat ota. A shader-ek semmit sem ernek ha nem lehet rendesen irni a vertex buffereket. A jelenlegi dx9-es vertex buffer iras megoldasa nagyon fajdalmas, es csak buffer texturakon kereszul mukodik. (tehat a kartya csak nullvektorokat kap, annyit amennyi kell, es maga huzza be a texturakbol a vertexeket, visszairas ugyanugy texturakba)

    Arrol meg hogy mennyire uj a dolog csak annyit, hogy az ibm pga kartyaja mar 1984-ben sajat teljes erteku cpu-t tartalmazott, es kepes volt videominosegben teszolegesen programozhato modon 3d gyorsitast biztositani belertve a vertex array-k es a display list-ek tamogatasat is. Az ibm biztositott hozza megfelelo fejlesztokornyezetet is, belertve a forditoprogramokat. A 320Kb memoriaja nem tunik soknak, de akkoriban csak a legnagyobb pc-kben volt 640Kb. A kartya meg isa buszt hasznalt, egesz pontosan ket slot-ot, mert 3 nyakbol volt osszerakva.

    Mit fejlodtunk? Tobb es gyorsabb processzor van egy gf8800-asban. Nagyobb a felhasznalhato memoria. Jobbak az alogritmusok es tobb van beloluk. Es... igen kb. ennyi. Az alapelv ugyanaz es a mukodes is.
  • dez #22
    "Csak az elavult rendszereken szamolja a fizikat es az animaciokat a proci."
    Butaság. Ha nincs Physix kártyád (+ támogatás a játékban), vagy 2.-3. GPU-d Havok FX-re (+ támogatás a játékban), akkor szerinted mi számolja a fizikát? Egy kismanó? (A Havok FX amúgy is csak egyes nem-interaktív effekteket számol, fullosabb fizikát nem.)
    Geomerty Shader nélkül ugyancsak a proci számolja az animációkat.

    "Mar a geforce1 ota van hardveres vertex kezeles, de az elso rendes vertex shader ota a polgionokat mar a shader-ek generaljak."
    Nem.
    1. A régebbi kártyák T&L engine-je - nevéhez hűen - csak transzformációt végez (elforgatás, perspektíva, stb.), poligongenerást (mint új poligonok) nem.
    2. A Vertex Shader önmagában nem tud új poligonokat generálni, erre csak a DX10-zel megjelent Geometry Shader képes. Ezen kívül az R8500 és későbbi ATI GPU-kban lévő TrueForm engine tud ilyet, tesszeláció keretében.

    "A modell-t egyszer fel kell tolteni es utanna csak az modell azonosito es a fazis szamat kell megadni es a kartya kirajzolja a megfelelo transzformaciok utan."
    A Geomerty Shader előtt ez max. csak előre elkészített fázisokkal (nem real-time változások) ment.

    "A fizikahoz pedig a legjobb a writeback tamogatasos shader. (dx10 vagy ogl) Igy lehetoseg van arra, hogy a kartya megkapja a teljes kombinalt fizikai es grafikai adatcsomagot, majd ebbol szamolja a fizikat, szamolja a grafikat, es csak a fizikai motor esemenyeirol szoljon a cpu-nak, ami csak a jateklogikat futtatja. (amire egyebkent eleg egy joval kisebb cpu is) Meg az mi is gyorsithato a gpu-val, pl. a leggyakrabban hasznalt utvonalkereses a flood fill egyik specialis fajtaja. Ezek az algoritmusok nagyon jol gyorsithatoak vektor egysegeken, viszont ujabban rengeteg kozvetlen memoriat kell elerniuk."
    Majd akkor fognak erre jobban rászállni, ha a piacon erős többségben lesznek a DX10-es kártyák, azok közül is a használható teljesítményűek...
  • kvp #21
    "Mivel a poligon-adatokat a proci szolgáltatja, és abból manapság nagyon sok van, ha ebben is alkalmazzák az SSEx-et, szép időt tölthet a proci ezzel."

    Csak az elavult rendszereken szamolja a fizikat es az animaciokat a proci. Mar a geforce1 ota van hardveres vertex kezeles, de az elso rendes vertex shader ota a polgionokat mar a shader-ek generaljak. A modell-t egyszer fel kell tolteni es utanna csak az modell azonosito es a fazis szamat kell megadni es a kartya kirajzolja a megfelelo transzformaciok utan.

    A fizikahoz pedig a legjobb a writeback tamogatasos shader. (dx10 vagy ogl) Igy lehetoseg van arra, hogy a kartya megkapja a teljes kombinalt fizikai es grafikai adatcsomagot, majd ebbol szamolja a fizikat, szamolja a grafikat, es csak a fizikai motor esemenyeirol szoljon a cpu-nak, ami csak a jateklogikat futtatja. (amire egyebkent eleg egy joval kisebb cpu is) Meg az mi is gyorsithato a gpu-val, pl. a leggyakrabban hasznalt utvonalkereses a flood fill egyik specialis fajtaja. Ezek az algoritmusok nagyon jol gyorsithatoak vektor egysegeken, viszont ujabban rengeteg kozvetlen memoriat kell elerniuk. Egy 1024x1024-es terkep mar minium 1Mb ram-ot igenyel /altalaban inkabb 8Mb-ot/, es erre lehet pl. utvonalkeresest kerni, persze csak ha van ennyi kozvetlen memoria a vektorprocesszor alatt. (gf8800-asban van, cell-ben pl. nincs, ott szenvedni es trukkozni kell)
  • dez #20
    ps. nézz be a ps3 topikba.
  • dez #19
    Egy érdekesség: ehhez az új NEC géphez hasonlóan a Cell+Opteron alapú IBM Roadrunnerben is 100 GFLOPS körül lesz 1-1 proci double-precision floating-point teljesítménye (Opteronokat kivéve). Csak abban 16000 Cell lesz, míg ebben (max.) 8192 proci lehet.
  • dez #18
    De, nagyon is fejlett grafikai rendszerek érhetők el hozzá, többek között: Software Support
    Továbbá csodálkoznék, ha egy fia OpenGL sem lenne hozzá.

    Ha másra nem, legalábbis 128 bites adatmozgatásra használják játékokban is az SSEx-et, de valószínű másra is. Mivel a poligon-adatokat a proci szolgáltatja, és abból manapság nagyon sok van, ha ebben is alkalmazzák az SSEx-et, szép időt tölthet a proci ezzel.

    Nem kell, hogy nagyon lassú legyen az emulált x86 proci: 8192 NEC prociból párszázat rá lehet szánni annak emulálására, pl. minden részegységet egy NEC proci emulálna...