Opteron és Cell chipek az IBM új szuperszámítógépében
← ElőzőOldal 2 / 2
Jelentkezz be a hozzászóláshoz.
#17
Bizony, fontos szempont a Cell brutális sávszéle is, hogy a parallel architektúrák támogatása. Itt visszájára fordul a kritikusok vesszõparipája: "a FLOPS nem minden". 😊
Apropó FLOPS, sajnos sokan nem fogják fel, hogy az S is hozzá tartozik a mértékegységhez, az jelzi az idõegységet. Mint a km/h-nál a h.
Még egy megjegyzés a cikkhez: a Cell eleve nem csak a PS3-ba készült, már a kezdetekkor terveztek más alkalmazást is.
Apropó FLOPS, sajnos sokan nem fogják fel, hogy az S is hozzá tartozik a mértékegységhez, az jelzi az idõegységet. Mint a km/h-nál a h.
Még egy megjegyzés a cikkhez: a Cell eleve nem csak a PS3-ba készült, már a kezdetekkor terveztek más alkalmazást is.
#16
Várjuk meg, mikor épít 4-core Core2-esekbõl szuperszámítógépet az Intel. (És mennyiért.)
#15
Magam is ezt az oldalt akartam linkelni.
Megjegyzések:
Double prec. Linpack 1kx1k-ben tényleg csak ~30%-kal gyorsabb, mint egy 3.6-os P4. (2kx2k-ban valamivel gyorsabb. Single-ben meg 6x-os, de ezt írtad.)
De ne csak ezt az egy adatot nézzük! Alább több alkalmazásnál akár 1db SPE is 2x gyorsabb, mint egy P4... 8 SPE így 16x-os teljesítményt hoz.
Bizonyos dolgokban meg 35x gyorsabb.
Kb. 2 éve írtam egyszer az IBM-nek (valamilyen Celles infó emailre), és rákérdeztem erre a Single Precision dologra, tehát hogy ez elég-e tudományos célokra. Azt válaszolták, hogy a legtöbb esetben elegendõ.
Megjegyzések:
Double prec. Linpack 1kx1k-ben tényleg csak ~30%-kal gyorsabb, mint egy 3.6-os P4. (2kx2k-ban valamivel gyorsabb. Single-ben meg 6x-os, de ezt írtad.)
De ne csak ezt az egy adatot nézzük! Alább több alkalmazásnál akár 1db SPE is 2x gyorsabb, mint egy P4... 8 SPE így 16x-os teljesítményt hoz.
Bizonyos dolgokban meg 35x gyorsabb.
Kb. 2 éve írtam egyszer az IBM-nek (valamilyen Celles infó emailre), és rákérdeztem erre a Single Precision dologra, tehát hogy ez elég-e tudományos célokra. Azt válaszolták, hogy a legtöbb esetben elegendõ.
#14
Nem gondolod, hogy az USA nukleáris program elõnyben részesedik a játékkonzolokhoz képest, meg ehhez adnám még hogy a Cell-t az IBM gyártja, tehát nem kell neki várnia, hogy legyen elég a piacon. A hír szerint egyébként 2007-ben lesz kész. Akkor az 1 PFLOPS azt hiszem elég komoly lesz (szerintem a jelenlegi BlueGene marad még egy évig a csúcs és az még csak picit több mint 1/4 PFLOPS. Különben sem lehet egy ilyen rendszert a Core 2-hez hasonlítani, igaz, hogy a Core 2 fogyasztása már nem olyan magas mint a NetBurst volt, de azért még mindég több mint a Cell, ugyanakkor a Core 2 nem lett Massive Paralell architektúrákra tervezve, míg a Cell igen és sokkal könyebben (olvasd) olcsóbban skálázható. Szóval senkinek sem fog az eszébe jutni, hogy Core 2-bõl szuperszámítógépet építsen (persze lesz esetleg cluster rendzser belõlle, de az nem fogja meg sem közelíteni a PFLOPS-ot).
Aztán a cikkben ki kellene javítani a dolgokat, mert "petaflopos" nem létezik, nem flop hanem FLOPS, vagyis FLoating point Operations Per Second.
Aztán a cikkben ki kellene javítani a dolgokat, mert "petaflopos" nem létezik, nem flop hanem FLOPS, vagyis FLoating point Operations Per Second.
Intel.DZ77RE-75K.Core.i7-3770K.32GB.RAM.360GB.RAID.SDD.8TB.RAID.HDD.GTX660Ti.Dual.NEC.Windows.10.Enterprise Apple.Mac.mini.Core.i7-3615QM.16GB.RAM.1TB.HDD.OS.X.El.Capitan
#13
Ahogy az oldalon is szerepel a SP max peak teljesítménye a cellnek 230 GFLOPS, DP-nél ez már lecsökken 21 GFLOPS-ra. És mire szélesebb körben hozzáférhetõ lesz a Cell, úgy hogy elég számú fölös kapacitás legyen a konzolos eladásokon felül egy ilyen project beindításához az még odébb lesz. Aztán utána még meg is kell építeni a rendszert. Mire elkészül szerintem lesz vagy 2010 addigra meg már az akkori eredményekhez mérten kell nézni ezt az 1 PFLOPS-ot.
Mire jõvõre elérhetõk lesznek jobban a Cell procik, addigra már az Intel is 4 coreos Core2-eseket fog gyártani. Double precisionban azok már biztos le fogják nyomni a Cell-t és SP-ben is egyre jobban a nyakára fog mászni, bár ott soká lesz még mire utolérik.
Mire jõvõre elérhetõk lesznek jobban a Cell procik, addigra már az Intel is 4 coreos Core2-eseket fog gyártani. Double precisionban azok már biztos le fogják nyomni a Cell-t és SP-ben is egyre jobban a nyakára fog mászni, bár ott soká lesz még mire utolérik.
#12
Ha beírod gugliba a linpack+cell mágikus szavakat akkor elsõnek egy ibm-es tesztet dob ki:
http://www-128.ibm.com/developerworks/power/library/pa-cellperf/
Kár hogy az összehasonlításban az Intelnek csak a régi NetBurst architectúrájú procija szerepel, kíváncsi lennék egy Core2-es WoodCresttel mit produkálna.
Mindesetre ebbõl is látszik hogy single precisionban a cell nagyon jó közel 6x gyorsabb mint P4-es. Viszont double precision esetén az elõny minimálisra csökken úgy ~35%-os. Ezt szerintem az új Core2-es architechtúra lazán behozta, fõleg azonos 3.2Ghz-es sebességen összevetve.
Persze szépek ezek a single precision eredmények a Cell-tõl de tudományos számításoknál nem hiszem hogy ilyennel szoktak számolni, ott azért a standard a double precision floating point.
http://www-128.ibm.com/developerworks/power/library/pa-cellperf/
Kár hogy az összehasonlításban az Intelnek csak a régi NetBurst architectúrájú procija szerepel, kíváncsi lennék egy Core2-es WoodCresttel mit produkálna.
Mindesetre ebbõl is látszik hogy single precisionban a cell nagyon jó közel 6x gyorsabb mint P4-es. Viszont double precision esetén az elõny minimálisra csökken úgy ~35%-os. Ezt szerintem az új Core2-es architechtúra lazán behozta, fõleg azonos 3.2Ghz-es sebességen összevetve.
Persze szépek ezek a single precision eredmények a Cell-tõl de tudományos számításoknál nem hiszem hogy ilyennel szoktak számolni, ott azért a standard a double precision floating point.
s/terrabyte/terraflops/
When using Linux - there\'re no walls, so we don\'t need any Gates or Windows, do we?
ahhoz az ,,osszedobnak'' reszhez csak annyit szolnek hozza, hogy a top100-ba bekerulo szuperszamitogepek messze a legdragabb reszegysege az interconnect, majd ezutan kovetkeznek a szerverek amikbe beleteszik a ramot, ezutan jon a RAM, majd _legvegul_ a processzorok. Raadasul az a 2 terrabyte messze all a valosagtol, ha akar a LinPack futtatasa eseten elerik a 100 GFLOPSt mar baromi joljarnak, de szerintem joval lentebb lesz az.
When using Linux - there\'re no walls, so we don\'t need any Gates or Windows, do we?
raadasul a 256 is mindossze az elmeleti korlat, a gyakorlat ennel joval rosszabb lesz, raadasul nem minden muveletre jon ossze a 256 sem (es mint mondtad nem is single precession 😊 )
When using Linux - there\'re no walls, so we don\'t need any Gates or Windows, do we?
#8
Izé...27, de jó lenne ha ezen a fórumon is lehetne a hsz-eket módosítani...
Szar játék az élet de qwa jó a grafikja!
#7
És így "csak" kicsit több mint 500 proci kéne. 25 db 20 procis szervert összedobnak és kész is...na jó, 22.
Szar játék az élet de qwa jó a grafikja!
#6
Én úgy tudom,hogy 2Tera Flop körül van, nem?
Szar játék az élet de qwa jó a grafikja!
#5
Szerintem egy szuperszámítógépen nem single precisionnal fognak számolni, fõleg nem nukleáris kutatásoknál. Akkor pedig a 256 gflops máris nem annyi.
A cell nyers teljesítménye 256gflpos. Ez alapján kb. 4000 darab kell. Ennél sokszor több procis gépek is vannak.
#3
Csak a lényeg hiányzik a hirböl 😊
Hány Cell ill. Opteron kell az 1 petaFlops hoz ?
Hány Cell ill. Opteron kell az 1 petaFlops hoz ?
Linux nem Win: http://www.unixlab.hu/LNW/index.html gentoo : http://www.gentoo.org/main/hu/philosophy.xml
#2
floating point operations per second, azaz a másodpercenkénti lebegõpontos számítások mennyisége.
Egy csúcs pc kb. 10 GFLOPS
Egy csúcs pc kb. 10 GFLOPS
Valaki segítene mit is jelent a "flop" ?
Köszi
Köszi
← ElőzőOldal 2 / 2