Új szuperszámítógépen dolgozik Japán
Jelentkezz be a hozzászóláshoz.
Kerlek, menjunk sorban.
"Mit nevezel "nagyteljesitmenyu szamitasok"-nak?"
High performance computing (HPC). Olyan alkalmazasok, ahol a szamitasi teljesitmeny maximalizalasa elsodleges szempont. FEA, aramlastan, numerikus matek (elsosorban numerikus linearis algebra, diffegyenletek, optimalizacio), asztronomia.... A multimedia hatareset, nemely reszei idetartoznak.
"Itt mi a "más jellegû"?"
Pl. olyan szamitasok, ahol a 64bites lebegopontos szamitasokra van szukseg. A HPC alkalmazasok 90+%-a ilyen es a Cell teljesitmenye tizedere (in terms of FLOPS) esik vissza double precision hasznalata eseten.
Megaztan ott van a 256MByte-os cimzesi korlat. A HPC alkalmazasok altalaban gigabyte hegyekkel dolgoznak, es sok esetben a programszegmens is nagyobb, mint 256 mega.
"Miért ne lehetne általános vektor-procikat más matematikai mûveletekre is használni, mint multimédia?" ill. " A Cell vektor-procijai miért nem "igazi" vektor-procik?"
Nem a multimedias igenyek szultek a vektorprocesszorokat (a PC-k vektorkiterjeszteseit mar igen!). Nem tudom, hogy a Cell elsodleges mag tartalmaz-e vektor egysegeket, de mintha az remlene, hogy csak a tarsprocikban van ilyen, es azokat explicite egy API-n keresztul kell majd hasznalni (valahogy ugy mint a DirectX-es GPU programozas). Tehat a mag csak annyira vektorproci, mint egy Mac, mas kerdes, hogy a vektor tarsprocesszor sokkal "kozelebb" van a maghoz, mint a GPU a CPU-hoz egy PC eseten.
Elmagyarazom miert szoktak szeretni az igazi vektorprocesszoros gepeket. Ha en ilyet szolok Fortran90 nyelven (tudom elavult, de a szuperszamitogepesek meg mindig csipazzak):
double precision a(100000),b(100000),c(100000)
a=b+c
akkor ezt mar a forditoprogram olyan gepi kodra forditja, hogy az elmeleti maximalis teljesitmeny kozeleben dolgozik a CPU. Nem kell szoszmotolni, hogy most akkor melyik tarsprocinak adjuk ki, nem kell speci API hivasokkal operalni ..... Meg lehet, hogy olyan forditoprogramjuk lesz, ami kepes a fenti trivialitast kiszurni, de az is lehet, hogy mar egeszen picit bonyolultabb konstrukciokat expliciten kell API-n keresztul leprogramozni. Esugye HPC alkalmazast portolgatni nagyon genyo (es draga) dolog, mert baromi nehez validalni a reszeket.
Egyebkent nagyon latszik a Cell-en, hogy HPC-s gyokerei vannak, de az is latszik rajta, hogy az elkeszult termek mar nem igazan jo ebbe a szegmensbe. Szinten az IBM altal gyartott PPC440 (BlueGene/L) valo ide, azzal meg multimediazni nem hatekony.
Csak referenciakeppen: a PPC440 (BlueGene) elso prototipusanak elkeszulte utan egy honappal mar a theoretical peak 90%-at ertek el HPL benchmarkban. Egy honap mulva nem fog meg 20 GFlops-ot sem teljesiteni a Cell mag.
Meg egy apro terminologiai dolog. Emlegettel parhuzamosithato szamitasokat (marminthogy abban jok a vektorprocik). Ez igy kicsit csusztatas:
- Az olyan alkalmazasokban, ahol maga az algoritmus sok parhuzamositasi lehetoseget tartalmaz (pl. rendezesek), ott nem igazan hatekonyak a vektorprocik. Illetve nem gyorsabbak, mint hagyomanyos tarsaik. Cserebe viszont dragak. A parhuzamosithatosagot hagyomanyosan erre a szintre ertjuk.
- Van egy alacsonyabb szintu parhuzamossag ez az un. loop-carried parallellism. Ebben nagyon jok a vektorprocik es nem tul jok a a hagyomanyosak, mert nagyon koltseges algoritmikusan parhuzamositani.
Intel.DZ77RE-75K.Core.i7-3770K.32GB.RAM.360GB.RAID.SDD.8TB.RAID.HDD.GTX660Ti.Dual.NEC.Windows.10.Enterprise Apple.Mac.mini.Core.i7-3615QM.16GB.RAM.1TB.HDD.OS.X.El.Capitan
Intel.DZ77RE-75K.Core.i7-3770K.32GB.RAM.360GB.RAID.SDD.8TB.RAID.HDD.GTX660Ti.Dual.NEC.Windows.10.Enterprise Apple.Mac.mini.Core.i7-3615QM.16GB.RAM.1TB.HDD.OS.X.El.Capitan
"A Cell NEM hasznalhato nagyteljesitmenyu szamitasokra."
Mit nevezel "nagyteljesitmenyu szamitasok"-nak? A jól párhuzamosítható számítási mûveletek (amikben egy vektror-proci jó) talán nem azok? Vagy ami erõsen ALU-igényes? Utóbbi inkább a "kevés számítás - sok feltételvizsgálat" kategóriája, de tényleg ilyenek lennének a tudományos számítások? Mert érzésem szerint inkább az ellenkezõje, de lehet, hogy tévedek.
"A Cell erosen multimedias feladatokra van hegyezve mas jellegu alkalmazasokban nagysagrendekkel romolhat a teljesitmenye"
Itt mi a "más jellegû"? Miért ne lehetne általános vektor-procikat más matematikai mûveletekre is használni, mint multimédia? (Világosíts fel minket sötéteket.)
"A japanok egy kicsit mas szemlelettel epitettek gepet, mint az amik. Pl. a japanok igazi vektorprocesszorokat alkalmaztak"
A Cell vektor-procijai miért nem "igazi" vektor-procik?
"Es a tetejebe programozasi szempontbol az ES maig a legjobb (ehhez a legkonnyebb hatekony alkalmazasokat irni)."
Állítólag a Cellel is hasonló a helyzet, kimondottan szempont volt ez a fejlesztésénél (+ a hozzá adott SDK
Linkek:
The CELL project at IBM Research
Idézet innen:
"The CELL Architecture
The CELL Architecture grew from a challenge posed by Sony and Toshiba to provide power-efficient and cost-effective high-performance processing for a wide range of applications, including the most demanding consumer appliance: game consoles. CELL - also known as the Broadband Processor Architecture (BPA) - is an innovative solution whose design was based on the analysis of a broad range of workloads in areas such as cryptography, graphics transform and lighting, physics, fast-Fourier transforms (FFT), matrix operations, and scientific workloads."
Cell
Idézet:
"The first-generation Cell processor is a multicore chip comprised of a 64-bit Power processor core and eight synergistic processor cores, capable of massive floating point processing, optimized for compute-intensive workloads and broadband rich media applications. A high-speed memory controller and high-bandwith bus interface are also integrated on-chip. Cell's breakthrough multi-core architecture and ultra high-speed communications capabilities deliver vastly improved, real-time response, in many cases 10 times the performance of the latest PC processors. Cell is OS neutral and supports multiple operating systems simultaneously. Applications will range from a next generation of game systems with dramatically enhanced realism, to systems that form the hub for digital media and streaming content in the home, to systems used to develop and distribute digital content, to systems to accelerate visualization and supercomputing applications."
A BlueGene/Q reszleteit illetoen nem kezdenek talalgatni, mert annak jo resze az IBM-nel is csak kocepcio.
Bar az IBM nagyon eros rivalis, az NEC Earth Simulator elegge kinos pont a jenki supercomputing torteneteben. Erdemes a Top500 allapotat megnezni, akkor amikor 2002-ben elkeszult a gep.
A japanok egy kicsit mas szemlelettel epitettek gepet, mint az amik. Pl. a japanok igazi vektorprocesszorokat alkalmaztak (talan SX-6 volt a neve), ami mellbevagoan jo teljesitmenyt adott (mind peak, mind sustained/peak viszonylatban) a HPL-ben es a gyakorlati eletben egyarant. Es a tetejebe programozasi szempontbol az ES maig a legjobb (ehhez a legkonnyebb hatekony alkalmazasokat irni).
Summa summarum: a japanok eltero felfogasban epitenek szamitogepet, mint az amik, ugyhogy csak a peak alapjan itelkezni kicsit felszines lenne (bar az ES peakben anno a tiz leggyorsabb amerikai gepet egyben lenyomta).
Intel.DZ77RE-75K.Core.i7-3770K.32GB.RAM.360GB.RAID.SDD.8TB.RAID.HDD.GTX660Ti.Dual.NEC.Windows.10.Enterprise Apple.Mac.mini.Core.i7-3615QM.16GB.RAM.1TB.HDD.OS.X.El.Capitan
Bár ezen lehet, h az UT kicsit szaggatna....😊 😊 😊
mert számolni tud, de mi lesz a vidkarival??? 😊 😊
vagy valami mátrixnyomtatóra adja ki a végeredményt hexában ???? 😊 😊 😊 😊
A bölcsek nem tudósok - a tudósok nem bölcsek Lao-Ce
Athlon64 3500+ | MSI K8N Diamond | Sapphire Radeon X850XT | 2*512 Samsung DDR | Creative Audigy2 | Maxtor 300 + 120GB SATA | Pioneer 109 | CoolerMaster Stacker ház | CoolerMaster RS-450-ACLY táp
Hejj, az UT 2007 (vagy Doom3 ízlés szerint) vajon hány FPS-t adna rajta...
Minden amit hallunk, vélemény, nem tény. És minden amit látunk, nézőpont, nem a valóság. - Marcus Aurelius
Cell processzoros IBM pengeszerver-alaplap