216
  • dez
    #216
    Egyébként most itt pontosan milyen szoftverről is van szó? Végülis egy IBM Cell SDK is elég bármihez, pl. PS3-ak clusteres számoltatásához is. Csak ugye szépen kézzel le kell programozni az egészet.

    A másik véglet meg az, hogy matematikai kifejezésekből clusteres párhuzamos vektoros kód-gyűjteményt generál. :) (Na én erre gondoltam az előbb.)

    A Mercury-s cucc mit csinál?
  • narumon
    #215
    Ezt a mercury SDKt kellene jobban megviszgálni akkor. Nem vagyok programozó tehát azt a részét nem értem.
  • narumon
    #214
    NEm mondtam hogy ők nem csinálták meg. Én azt mondtam, hoyg csináljuk mi is meg. Szvsz lenne rá vevő, de csak mint kész megoldás. Nem nagyon van az egyetemeken olyan emberke aki ráér erre molyolni...
  • NEXUS6
    #213
    Hát erről az üzletről asszem lekéstetek, mert a Mercury Computer Systems már kiadott egy ilyen progit, amivel PS3 clustereket lehet csinálni kifejezetten tudományos feladatokhoz!;)))

    Amúgy ha valaki veszi a fáradtságot, akkor az egyetem cikkben szereplő linkjén utána nézhet, hogy milyen szoftvereket használtak a rendszer felépítésénél, pl Fedora 5/6 Linuxot, IBM cell SDK-t, a message-passing technológiához, meg OpenMPI-t, szal ingyenesen hozzáférhető dolgokat.
    Hát ők ezexerint meg tudták csinálni, de biztos csaltak!;)))
  • dez
    #212
    Először talán megpróbálok számoltatni egyet. Aztán jöhetne egy adott feladat kiterjesztése több gépre. Viszont egy ilyen univerzális rendszer létrehozására (amivel bármilyen "számoltatást" clusterezve el lehet végeztetni, ha erre gondoltál) nem igazán vállalkoznék, az már egy kicsit nagy falat. Nem is tudom, létezik-e egyátalán ilyen bármilyen clusteres rendszerre vagy szuperszámítógépre.
  • dez
    #211
    Az egy dolog, de ha olyan rossz lenne a Cell, mint egyesek mondják, hiába lenne minden - túl botrányos lenne a dolog.
  • dez
    #210
    LOL, mintha elfelejtenéd, hogy a Sony veszteséggel árulja a PS3-at, miközben az IBM magas haszonkulccsal a saját cuccait.
    1/10 annyi pénzért -2 SPE, és fele ram, ez nem olyan rossz... (Oké, PS3-on Infiniband sincs, de legalább van egy gyors LAN port.)
  • dez
    #209
    Hahó, te azt írtad, nem is ugyanaz a Cell, és a PS3-as [i]erősen[/b] lebutított. Holott csak egy SPE van letiltva. (Egyet meg az alap firmware használ, többek között hang en-/dekódolásra.)

    Ha raytracingre ennyire jó a Cell (és ennyivel jobb, mint a G80), akkor sokminden másra is jó.
  • narumon
    #208
    Egyébként meg; Annyira frankó programozó vagy. Szedjél össze egykét havert csináljatok szoftvert amivel clusteres ps3-akat lehet számoltatni nagy teljesítményen. Ha életképes akkor én eladom!
  • narumon
    #207
    "amikor rájuk esik a választás, azt csinálnak, amit akarnak. Azzal, hogy az IBM nyert, az elbírálók a Cellre is rábólintottak."

    Jaaaaaj ez a naívság. Ugye nem kell elmondanom, hogy hogy zajlik egy ilyen nagyobb beszerzés eldöntése. Külföldön persze nem akkora méretekben mint magyarországon, de azért ott is jelen van. Túl sok pénz...
  • narumon
    #206
    "Ha viszont spórolni kel..."

    Olcsó húsnak...
  • narumon
    #205
    Örülök mikor engem igazolsz végül. Jópár hozzászólással ezelőtt még lehülyéztél azért mert azt mertem mondani hogy az IBM Cell kissé erősebb. Egyébiránt meg, a mi profilunk (cégnél) többek között tudományos számitásokra gépeket eladni. Nem fogod elhinni de sehol nem fut ray tracer program rajta...
  • dez
    #204
    "Erre az volt a szimpla válasz, hogy azért mert azok nem neki hoznak hasznot, nem ő gyártja őket. Ha az IBM történetesen videokártyákat gyártana akkor abból építené és nem a cellből."
    Én meg erre válaszoltam azt, hogy akkor nem feltátlenül az IBM nyerte volna a tendert. Tudod, ez nem úgy megy, hogy "én akarom, én akarom!", és amikor rájuk esik a választás, azt csinálnak, amit akarnak. Azzal, hogy az IBM nyert, az elbírálók a Cellre is rábólintottak.

    "Azonkivül szerintem a cell-el mint processzorral nem is volt itt senkinek sem baja. Legalábbis nem rémlik, hogy valaki ezt támadta volna."
    Hát dehogynem, lásd amiket kvp írt. (Persze itt-ott volt benne igazság, de kicsit eltúlozta a dolgokat. Persze millió "rendes" prociból is jó gép építhető, csak nem túl költséghatékony a dolog.)

    "Viszont a ps3 az nem maga a Cell processzor..."
    Nyilván megvannak a hátrányai (pl. kevés memória), és előnyei (ár) pl. egy IBM-es Cell blade laphoz képest.

    ps. egyébként a szuperszámítógép nem egy szerver, hanem egy nagy cluster.
  • dez
    #203
    "Csak azt állitani, hogy azért nyert itt a cell mert az a legjobb , ez miatt dőreség."
    És ki írt ilyet?

    "Ráadásul ez is bizonyitja azt amiről folyamatosan beszélek. Nem 1000db Ps3-at rendeltek, hanem egy IBM szervert!"
    Még jó, hogy egy katonai szupergépet nem PS3-akból építenek fel. Ha viszont spórolni kel...
  • dez
    #202
    Cell vs. G80 @Raytracing

    Méretek, tranzisztorszámok, és raw flops-ok:


    Ehhez képest raytracing-performance:


    Ugye látod ezt, kvp? ;)
  • narumon
    #201
    Azt irtad: "Mit gondolsz, az IBM miért Cellekből (plusz kiegészítésnek Opteronokból) építi a köv. világelső szuperszámítógépét, a Roadrunnert, nem G80-akból vagy R600-asokból?"

    Erre az volt a szimpla válasz, hogy azért mert azok nem neki hoznak hasznot, nem ő gyártja őket. Ha az IBM történetesen videokártyákat gyártana akkor abból építené és nem a cellből.
    Azonkivül szerintem a cell-el mint processzorral nem is volt itt senkinek sem baja. Legalábbis nem rémlik, hogy valaki ezt támadta volna. Szerintem egy jó processzor és ezt mindenki elismeri. Viszont a ps3 az nem maga a Cell processzor...
  • narumon
    #200
    "És, ez mit von le a dolog értékéből?"

    Természetesen semmit. Csak azt állitani, hogy azért nyert itt a cell mert az a legjobb , ez miatt dőreség. Akkor amelyik tenderen az AMD nyer akkor az a legjobb?
    Ráadásul ez is bizonyitja azt amiről folyamatosan beszélek. Nem 1000db Ps3-at rendeltek, hanem egy IBM szervert!
  • dez
    #199
    'sokszor utasítás-szinten keveredik a két fajta művelet'
  • dez
    #198
    Hanem mi?
  • dez
    #197
    És, ez mit von le a dolog értékéből?
  • narumon
    #196
    Miért kéne, hogy ugyanazt számolják?
  • narumon
    #195
    Jah ráadásul nem is ez volt a kérdés...
  • narumon
    #194
    "Csakhogy az IBM nem csak úgy magának építi a Roadrunnert, hanem katonai tenderre, ahol más cégek is indultak, mégis az IBM nyert, konkrét tervekkel természetesen. Tehát az elbírálók szerint is használható a Cell"

    Meg rengeteg más helyen nyert az AMD és az Intel is, és még sorolhatnám.
  • dez
    #193
    Ja, a hasonlat kimaradt:

    "Itt a hasonlat az, hogy cell spe eseten csak 8 kis betonkevero van amiket kezzel kell megtoltni es kiuriteni, mig a masik ceg 3 nagy betonkevero teherautot ad, amik toltik es uritik is magukat. Melyikkel lesz konnyebb a munka es kell hozza kevesebb ember???"

    Sántít ez a hasonlat. Éppenhogy a 8 betonkeverő a nagyobb, csak nem hétköznapi, amivel - mint Nexus6 is írta - Józsi bácsi is elboldogul, hanem speciális, nagyteljesítményű gépek, amikhez szakszemélyzet kell, viszont ontják is a betont.
  • dez
    #192
    Csakhogy az IBM nem csak úgy magának építi a Roadrunnert, hanem katonai tenderre, ahol más cégek is indultak, mégis az IBM nyert, konkrét tervekkel természetesen. Tehát az elbírálók szerint is használható a Cell.
  • dez
    #191
    "Igy van és azt is irja, hogy ezért használják mellette a cpukat is. Az pedig van minden gépben."
    Ez nem ilyen egyszerű, mert sokszor utasítás-szinten keveredik a két fajta művelet, miközben most a CPU és a GPU közötti kapcsolat nagyon lassú ehhez.

    "A lényeg hogy az eredményeknél az jön ki hogy egy gpus gép gyorsabban számol jóval."
    Csak nem ugyanazt.
  • dez
    #190
    "Erre irtam, ha ugyanezeket elinditom haver xps gépén az lényegesen kezesebben viselkedik ilyenkor."

    Erre kérdeztem, hogy 256MB rammal? Azt kötve hiszem, hogy az XP spórolósabb lenne a memóriával, mégis el lehet lenni 256MB rammal (+ virtuális memória) - nemrég anyáméknál volt alkalmam ezt megtapasztalni.

    Egyébként talán a későbbiekben használhatóvá válik majd a VRAM is, akkor összesen 512MB lesz.
  • dez
    #189
    Azért ha csak üzenni akarsz valakinek, vagy más apróbb műveletet végrehajtani, jó, ha nem kell ide-oda szaladgálni. Meg ugye nem csak magadból kellene kiindulni.
  • dez
    #188
    btw, korábban említettél valami olcsó touch-screen panelt (gondolom, LCD-vel együtt, mert nélküle én is tudok), írnál róla valami infót?
  • dez
    #187
    Na, asszem ideje válaszolnom.

    "Szerintem inkabb probald ki. En is ezt tettem. Nagyon jo szorakozas... bar lehet hogy csak azert tunt konnyunek mert mar ismertem a forditot."
    Mi tűnt könnyűnek? Lefordítani egy kisebb programot? Nem ez a nehéz, hanem a CUDA-t komolyabb célokra használni szándékozók szerint optimális kódot készíteni, ami nem csak fut, de értelmes sebességgel fut.

    "A scatter-gather i/o pedig nagyon jol jon pl. raytrace-hez. De lehet alatta rendes grafikus/fizikai motorokat is irni, ahol minden latott polygon egy fizikai objektum resze, vagy dinamikusan valtozik a polygon-ok szama a kivant reszletesseg fuggvenyeben. (cpu beavatkozas nelkul)"
    Kár, hogy ezeket még nagyon lassan viszi - lásd Geometry Shader teljesítmény a béka feneke alatt.

    "Bar a local store-juk nem eppen szep, de mivel van rendes memoria i/o es smt ezert ez nem igazan szamit. (ha nem fer el az adat legfeljebb lassabb lesz a program, de mindenkeppen futni fog)"
    Ja, legfeljebb 100x lassabb...

    "Nem tudom neked mi az eleg, de egy gyakorlatban is hasznalt mintailleszto rendszerben 256MB volt a local store. (1 orajeles statikus ram-bol felepite) Az hozta a megfelelo teljesitmenyt, raadasul powerpc alapu rendszer volt. Egy mai jobb jatek mi vagy fizikai motor dataset-je neha nagyobb ennel, bar egy lepes soran nem dolgozodik fel az egesz. A baj az, hogy az algoritmus nem tudja elore mi fog kelleni neki."
    2MB (8*256KB) már elég sok dologra elég.

    "Talan mert sok cell-uk van raktaron es az nvidia bevetele nem az o hasznukat noveli?"
    Hát ez nem egészen így ment, ugyanis akkor nem az IBM kapta volna a megbízást.

    "A memoria fele mar nem olyan nagy a savszelesseg"
    De igen, a memória felé ennyi. Az LS felé jóval gyorsabb.

    "es a scatter gather i/o-t hasznalo algoritmusok igenis quadword-onkent akarnak olvasni."
    Ez oké, de sokszor át lehet variálni a dolgokat. Nem emlékszel a múltkor hogy átalakítottam a példádat?

    "En jatekra gondoltam elso korben. A ps3 alapvetoen jatekkonzol. Ha arra nem jo, akkor nem josolok neki tul fenyes jovot."
    Majd meglátjuk néhány év múlve, jól gondoltad-e.

    "Probaltad mar hasznalni az stl library-t cell spe-n? Es sikerult is?"
    Még nem. De itt fordítókról volt szó, és azok vannak. (Én amúgy is mindent szeretek magam megírni.)

    "Akkor ezert jobbak es van tobb linux-os jatek?"
    Nem csak játékokról van itt szó.

    "A cell-el az a baj, hogy az spe-k nem ugy mukodnek ahogy a vilag osszes tobbi altalanos cpu-ja teszi ezt egy ideje."
    PC-s vonalon is jönnek majd a hasonló inhomogén chipek.

    "Az ibm fele cucc jo resze open, tehat mashol is hasznalhato."
    A kimondottan Cell-orientált dolgok nem igazán.

    "Szerintem inkabb valami kesz kod jobb lett volna, mondjuk szabvanyos formaban. Hivhatnak felolem akar sony direct-opengl-nek is, csak ne techdemokbol allna."
    Tudod, vannak a lusta programozók, és a nem-lusták. Az egyik összeollózik valamit kész kódokból, a másik a példákból megérti, mit hogy jó csinálni. Tudom, tudom, könnyed (multiplatform) fejlesztés, stb. Viszont ez egy konzol, nem egy Windows-box.

    "Hanem hogy van? Mert kesz algoritmus meg egyelore nagyon keves van. Demok vannak, de eles project-ben ezek a kodok kapasbol buknak, mert nem szabvanyosak."
    Lásd fent.

    "De egy mai jatekban nagyobb az adatmennyiseg, es egy spe nem skalazodik felfele, mert a memorialimit bele van egetve az architekturaba. Legalabbis a ps3 cpu-jaba igen. Es ki akarna gpu-s shader logikat futtatni a fo processzoron? A szoftver renderelo mar kiment a divatbol."
    A PS3 esetén legalább van erre kapacitás, az Xbox360-nál nem sok.

    "Kb. ennyit rak az ember az otthoni barkacs hardverebe, hasonlo 1 orajeles sram formajaban. (mikrovezerlokben van kb. ennyi) Profi felhasznalasra mar tobbet szokas."
    A GPU-kban még ennyi sincs, legalábbis a G80-ban az újak közül - az R600 valamivel jobban el van eresztve. Tehát még az újabb GPU-k sem többszörösen rekurzív kódokra, és más effélére vannak szánva.

    "Ha meg olcson akarjuk meguszni akkor tobb lassabb egyseg es smt alapu thread valtas amig a kert adat megjon. Ezt hasznalja a gf8800-as."
    Nem tudok róla, hogy az egyes egységek össze-vissza tudnának váltani a threadek között. Regiszterkészletből is annyi kellene.

    "Meg a barkacs xbox360 is kapott 10 Mb nagyon gyors edram-ot, ami kb. az sram-ok szintjen van sebessegben, csak valojaban dram. Ilyet akar rakni az ibm az uj powerpc cpu-jaiba. A cell2-ben talan mar lesz is."
    Az xbox360 esetén ennek felhasználhatóságe elég szűkös - és a nagy sávszél nem a GPU és az EDRAM között áll fenn, hanem csak az EDRAM-on belül, a ram és az ott lévő kisméretű logika között.

    "Ha lenne, akkor nem az agyhalott dma rendszert hasznalna. Epp ez a gondom az egesz cell-el, hogy ezt az egy aprosagot kihagyak, mivel az spe nem tud sem hardveres smt-t, sem prediktiv memoria i/o-t, ezert a virtualis memoria kezeles csak lock-olna a teljes feldolgozast amig a lassu rambol megjon az adat, igy inkabb nem raktak bele."
    Valami azért van, mert mindegyiknek van egy MMU-ja. Mindenesetre, 32 bitesek a címek, így ha máshogy nem, szoftveresen megoldható a lapozás. Ez persze lassú hétköznapi kód esetén, de lehet optimizálni rajta.

    "Kis adatkeszletnel ez igaz. Ha elfogy a 256KB (kilobyte!) akkor jonnek elo a gondok. Azert ez mar nem egy olyan nagy adatmennyiseg hogy egy fizikai modell ne tartalmazzon tobb adatot. (es meg a programnak is bele kellene fernie)"
    Nyilván bonyolódnak a dolgok 256KB (vagy kooperatív munka esetén 2MB felett), de sok esetben nem túlzottan.

    "Probald ki! A linux eredetileg M68k-ra optimalizalt valtozata tokeletesen fut barmilyen memoriavedelem nelkuli rendszeren, bar driver nem nagyon lesz hozza, de vegulis csak egy shared memory alapu driver stack kell neki (csomag i/o alapu virtualis hardverekkel, amiket a kulso cpu kezel). Last nommu-s kernel. A kod egyszalu resze nagyon lassu lesz, de a parhuzamos feldolgozas sokat nyer a 128 maggal."
    Az "általános CPU" azt jelenti, hogy általános kódot értelmes sebességgel futtat. A G80 erre nem képes, csak nagyon lassan. Nagyon is specializált rendszer. A gyosítás nem egyszerű párhuzamosítás, hanem sok kötöttségre kell odafigyelni.

    "Van mar devkit-ed? Ha nincs vetess a cegeddel egyet es megerted miert kap hulyet tole a legtobb fejleszto."
    Jelenleg megbízásos magánzó vagyok, szal max. magam vehetek egy PS3-at, és szórakozhatok Linux alól.

    "Mutass egy ceget magyarorszagon ahol ps3 exkluziv fejlesztes van es eppen van felvetel rendes fizetessel... egyszeruen a ps3 exkluzivitas nem jellemzo a mai cegekre. Mindeki csak egyszer ir es sokszor fordit. Mondjuk ez az eladasok tukreben ertheto."
    M.o. kis ország - a világon máshol azonban vannak ilyen fejlesztések. És ahogy beindul a szekér, több is lesz.

    "Egyebkent meg en teljesen tisztaban vagyok azzal, hogyan lehetne jo kodot irni a cell-re. Jol szegmentalhato adatmodell kell, vektoros feldolgozas, manualis memoriakezeles, es buta, de gyors cpu-t igenylo algoritmusok. Az egyetlen gond, hogy egy ilyen kod nem futna jol mas cpu-kon. Ha egy ceg valaszthat, hogy fejleszt az osszes tobbire vagy ps3 exkluziv lesz, akkor az elsore fog tenni. Es meg tobbet is adnak el az osszes tobbi gepbol (pc, xbox360, wii) tehat tobb jatekot is fognak rajuk venni."
    A PS3-mal viszont különlegesebb dolgokat lehet csinálni, és ha megjelenik 1-2 ilyen, az jó hatással lesz az eladásokra is - utána megéri majd több ilyet fejleszteni.

    "===Mas==="
    Egyszerűbb lenne használni a "válasz erre"-t (akkor a visszakövetés is könnyebb), és személyesen válaszolni.

    "Majd jopar ev mulva mar lesz rendes tamogatas, de addigra elavul a cell."
    A PS3-ban lévő igen, de közben lesznek újabb Cellek is, több+okosabb PPE-vel, SPE-vel, LS-sel.

    "A hagyomanyos algoritmusok pedig cpu-tol fuggetlenul barhol jol fognak futni a jovoben is, mig a cell-re optimalizaltak csak a cell-eken."
    Mint írtam, PC-s vonalon is jönnek majd a heterogén chipek (náhány sima CPU mag, és jópár SIMD-alapú mag). (Poén lenne, ha azok is DMA-sok lennének a jobb helykihasználás érdekében. :P)
  • NEXUS6
    #186
    Szerintem de!;)))

    Legalábbis nálam ez az elsődleges számítógép.
    Az persze, hogy kinek mi a jó, elég viszonylagos. Nem tökéletes, de használható.
  • narumon
    #185
    Nem is arról beszéltünk hogy a cellen milyen a linux, hanem hogy a ps3-mon. És mint te is elismered, nem túl jó. Lehet, hogy ez idővel változik majd, de jelenleg nem lehet pcként használni bármit is állit dez.
  • NEXUS6
    #184
    "Itt a hasonlat az, hogy cell spe eseten csak 8 kis betonkevero van amiket kezzel kell megtoltni es kiuriteni, mig a masik ceg 3 nagy betonkevero teherautot ad, amik toltik es uritik is magukat. Melyikkel lesz konnyebb a munka es kell hozza kevesebb ember???

    Az edge konyvtarrol meg annyit, hogy nem eri el a directx szinvonalat, pedig ebben az esetben nincs tul magasan a lec. Majd jopar ev mulva mar lesz rendes tamogatas, de addigra elavul a cell. A hagyomanyos algoritmusok pedig cpu-tol fuggetlenul barhol jol fognak futni a jovoben is, mig a cell-re optimalizaltak csak a cell-eken."

    Tudom, hogy értelmetlenség egy szinten tovább vinni a hasonlatot de épp fordtva van a dolog. A hagyomágyos szimmetrikus magos architektúrák speciális "betonkeverési" feladatra éppen lassúbbak. Igaz ott van mellettük az általános célú józsibácsi, akinek nem kell a szájába rágni hogy mit csináljon, addsz neki 10-ezer forintot és elmegy cementért a kis betonkeverőjéhez, és még a cébéába is beugrik a söréért.

    A cellben viszont ott van 8 db "betonkeverős teherkocsi", ami lehet hogy csak a betongyárból tud betont hozni, és a sofőrök is EU normáknak felelnek meg, szal munkaidőben önállóan nem ugranak be sörért, és a szállítólevelüknek is teljesen rendben kell lenni, de ők nem családi házat fognak neked építeni, hanem felhőkarcolót!

    Igen a Sony viszonylag elmaradásban van a könyvtárak tekíntetében, de lehet hogy sokkal több támogatást is kapsz tőlük a programozó kommandó képében, ha exkluzív progit fejlesztesz a platformra, mint amit a M$ adna. (Lásd UT3 esete).
  • NEXUS6
    #183
    Ha próbáltad, akkor számodra is nyilvánvaló gondolom, hogy nem a cell sebességével van gond, hanem hogy a Linuxot is úgy írják manapság, hogy ha grafikus felületet használsz, akkor végtelen mennyiségű memória sem elég. Na erre a PS3-nak van kb 200MB-ja amiből tud gazdálkodni. Szal nem a cell a lassú!!!

    Ez egy Firefox, egy egyszerűbb média lejátszó, meg mondjuk egy torrent kliens használatát jelenti egyszerre. Ha még valamit elindítasz akkor az ablakok/programok közötti váltás megismertet az örökkévalóság élményével, de az előbbi program összetétel még teljesen OK! Szal kb 3 dolgot tudsz futtatni egyszerre.

    Ja és mégegyszer, pl. a MPlayer SPU támogatása is még csak most lesz elérhető, szal minden a PPE-n fut.
  • narumon
    #182
    Réadásul az nvidia a tesla supercomputerrel közvetlen vetélytárs is.
  • narumon
    #181
    "Ez is tévedés. Mit gondolsz, az IBM miért Cellekből (plusz kiegészítésnek Opteronokból) építi a köv. világelső szuperszámítógépét, a Roadrunnert, nem G80-akból vagy R600-asokból?"

    Talán azért mert a Cellt ő gyártja a többit meg a konkurencia? Nah vajon miért?
  • narumon
    #180
    "a GPU-k egyszerűbb számításoknál nagyon gyorsak, de ha már kicsit összetettebb dolgokról van szó, erősen visszaesik a teljesítményük! Sőt bizonyos algoritmusokra még nem is alkalmasak."

    Igy van és azt is irja, hogy ezért használják mellette a cpukat is. Az pedig van minden gépben. A lényeg hogy az eredményeknél az jön ki hogy egy gpus gép gyorsabban számol jóval.
  • narumon
    #179
    "Magam ugyan még nem próbáltam, de többen, akik normálisan fel tudtak tenni egy Linuxot"

    Figyelj, mint irtam én próbáltam és ugyanarról számoltam be mint amiről Nexus is a ps3 topicba. Megy meg minden, de ha egyszerre megy levelezés, internet, mp3, stb, akkor azért már türelem kell hozzá. Erre irtam, ha ugyanezeket elinditom haver xps gépén az lényegesen kezesebben viselkedik ilyenkor.
  • narumon
    #178
    "És most egymás mellett fogsz tartani egy PS3-at és egy ilyen csúnya (fehér bádogdobozos ennyiért) kis PC-t a nappaliban?"

    Hát egyrészt szerintem a ps3 sem lett szebb, másrészt meg nem. A nappaliban a tévé alatt a konzolom van. A számitógép egy másik szobában van monitorral. Eszembe sem jut a tévé előtt számítógépezni, feleségem biztos kinyirna. A "dolgozószobában" is elég nagy kupi van emiatt.
  • kvp
    #177
    ""Es a kulso memoriacimzes tamogatasa miatt meg c++-os kod is elfut rajta"
    Na persze, ahogy azt pistike elképzeli. Beszélj egy CUDA programozóval."

    Szerintem inkabb probald ki. En is ezt tettem. Nagyon jo szorakozas... bar lehet hogy csak azert tunt konnyunek mert mar ismertem a forditot. A scatter-gather i/o pedig nagyon jol jon pl. raytrace-hez. De lehet alatta rendes grafikus/fizikai motorokat is irni, ahol minden latott polygon egy fizikai objektum resze, vagy dinamikusan valtozik a polygon-ok szama a kivant reszletesseg fuggvenyeben. (cpu beavatkozas nelkul) Bar a local store-juk nem eppen szep, de mivel van rendes memoria i/o es smt ezert ez nem igazan szamit. (ha nem fer el az adat legfeljebb lassabb lesz a program, de mindenkeppen futni fog)

    ""mig a cell spe-kben erre nincs eleg kozvetlenul cimezheto memoria."
    256KB/SPE épp elég kisebb programokhoz+adatokhoz. (Ezt mikrokontrolleresként tudnod kellene.) A többit meg lehet DMA-zni viszonylag nagy sávszéllel."

    Nem tudom neked mi az eleg, de egy gyakorlatban is hasznalt mintailleszto rendszerben 256MB volt a local store. (1 orajeles statikus ram-bol felepite) Az hozta a megfelelo teljesitmenyt, raadasul powerpc alapu rendszer volt. Egy mai jobb jatek mi vagy fizikai motor dataset-je neha nagyobb ennel, bar egy lepes soran nem dolgozodik fel az egesz. A baj az, hogy az algoritmus nem tudja elore mi fog kelleni neki.

    ""A gyenge pontjuk a cimezheto memoria kis merete, ami miatt hasznalhatosagban csak a dsp chipekkel tudnak versenyezni, egy gpgpu-val mar nem."
    Ez is tévedés. Mit gondolsz, az IBM miért Cellekből (plusz kiegészítésnek Opteronokból) építi a köv. világelső szuperszámítógépét, a Roadrunnert, nem G80-akból vagy R600-asokból?"

    Talan mert sok cell-uk van raktaron es az nvidia bevetele nem az o hasznukat noveli?

    ""A dma-s ram kezeles olyan mint amikor egy videokartya a rendszer rambol probal texturazni. Mukodik, de nagyon lassu."Nem olyan nagyon lassú (hacsak nem quadwordonként akarnak olvasni), mivel itt egy ~25 GB/s-es elérésről beszélünk, nem a töredékéről."

    A memoria fele mar nem olyan nagy a savszelesseg es a scatter gather i/o-t hasznalo algoritmusok igenis quadword-onkent akarnak olvasni.

    ""A gf8800-as egyszeruen egy jobban hasznalhato architektura"
    Attól függ, mire akarják használni őket. Ezt kellene legalább megértened."

    En jatekra gondoltam elso korben. A ps3 alapvetoen jatekkonzol. Ha arra nem jo, akkor nem josolok neki tul fenyes jovot.

    ""A forditoprogramok nem boldogulnak veluk, mert nincs ilyen architekturara optimalizalt fordito."
    Dehogynincs. Még a GCC-hez is van SPE támogatás, az IBM készít két saját C-fordítót is (egy egyszerűbbet és egy szuperszámítógépre optimizáltat),"

    Probaltad mar hasznalni az stl library-t cell spe-n? Es sikerult is?

    ""es jobb szoftvertamogatassal rendelkezik mint a ps3 mivel a microsoft (dx10) es az nvidia (gpgpu) is ott all mogotte."
    A Cell mögött meg az IBM, a Sony, a Toshiba, számos más cég, egyetemek, egyes katonai szervezetek, és az opensource közösség egy része is."

    Akkor ezert jobbak es van tobb linux-os jatek? A cell-el az a baj, hogy az spe-k nem ugy mukodnek ahogy a vilag osszes tobbi altalanos cpu-ja teszi ezt egy ideje.

    ""A sony elfelejtett egy akkora szovtverkonyvtarat adni a cell-hez ajandekba mint amilyen a microsoft directx."
    DirectX? Most miről beszélünk, játékokról, vagy tudományos+egyéb felhasználásról? Ha utóbbiról, nézd meg az IBM kínálatát, ha játékokról, akkor meg lásd a Sony fejlesztő-csomagját."

    Az ibm fele cucc jo resze open, tehat mashol is hasznalhato. A sony fele kit-ben meg nem sok dolog van a (butitott) opengl-en es mas alap library-ken kivul. A segedkonyvtarak jo resze meg mindig hianyzik, mint ahogy a stabil online felulet is csak keszul, de sajnos meg mindig nem eri el a microsoft szinvonalat. Pedig a sony minden elerheto ingyenes komponenst is beepitett.

    A sony szovegebol:
    "rather than an overarching engine, these teams have chosen to create specialized systems that demonstrate best practices of SPU and RSX utilization."

    Szerintem inkabb valami kesz kod jobb lett volna, mondjuk szabvanyos formaban. Hivhatnak felolem akar sony direct-opengl-nek is, csak ne techdemokbol allna.

    "Ha nincs ra algoritmus, nincs ra rendes fordito, akkor baromi nehez barmit is kihozni."
    Csakhogy ez nem egészen így van."

    Hanem hogy van? Mert kesz algoritmus meg egyelore nagyon keves van. Demok vannak, de eles project-ben ezek a kodok kapasbol buknak, mert nem szabvanyosak.

    ""A jatekok meg jo ideje rengeteg uzleti logikahoz hasonlo feladatot vegeznek, azaz sok felteteles elagaz van a programokban, meg a v2-nel jobb shader-ekben is."
    Sokat, de nem annyit, amennyivel ne boldogulna el a PPE (vagy akár egy SPE, ha megfelelően kicsi az adatmennyiség)."

    De egy mai jatekban nagyobb az adatmennyiseg, es egy spe nem skalazodik felfele, mert a memorialimit bele van egetve az architekturaba. Legalabbis a ps3 cpu-jaba igen. Es ki akarna gpu-s shader logikat futtatni a fo processzoron? A szoftver renderelo mar kiment a divatbol.

    ""Nem. Tobbnyire DSP-ket es mikrovezerloket szoktam programozni, tehat ismerem a problemakat."
    Valóban? Hát itt azért nem egészen egyszerű DSP-kről és mikrokontrollerekről van szó.
    Meg nem tudom, hogy programozol, de érdekes, hogy ehhez képest mennyire lebecsülöd azt a 256KB-ot."

    Kb. ennyit rak az ember az otthoni barkacs hardverebe, hasonlo 1 orajeles sram formajaban. (mikrovezerlokben van kb. ennyi) Profi felhasznalasra mar tobbet szokas. Tudom hogy 256 _MB_ sram eleg draga, de gyors is es bele is fer a legtobb jelenlegi adat. Persze tudok mondani olyan esetet a kozeljovoben amikor meg ez is keves lesz. Ha meg olcson akarjuk meguszni akkor tobb lassabb egyseg es smt alapu thread valtas amig a kert adat megjon. Ezt hasznalja a gf8800-as. Meg a barkacs xbox360 is kapott 10 Mb nagyon gyors edram-ot, ami kb. az sram-ok szintjen van sebessegben, csak valojaban dram. Ilyet akar rakni az ibm az uj powerpc cpu-jaiba. A cell2-ben talan mar lesz is.

    ""Egyik sem tul gyors, es mivel az spe-ben nincs hardveres virtualis memoria kezeles"
    De, tudomásom szerint van!"

    Ha lenne, akkor nem az agyhalott dma rendszert hasznalna. Epp ez a gondom az egesz cell-el, hogy ezt az egy aprosagot kihagyak, mivel az spe nem tud sem hardveres smt-t, sem prediktiv memoria i/o-t, ezert a virtualis memoria kezeles csak lock-olna a teljes feldolgozast amig a lassu rambol megjon az adat, igy inkabb nem raktak bele. A full crossbart meg csak sporolasbol hagytak ki, az meg az ibm mernokeit is zavarta, bar tenyleg nem sokat javitott volna a helyzeten. (6-rol 1-re vitte volna a belso busz latency-jet es 3-szorosara a saveszelt, ami ugye igy is eleg)

    ""Ma mar kaphatoak 8 magos rendszerek (2x4 mag)."
    Aha, csak épp túl drága átlagfelhasználásra, és igen lassan és nagy késleltetéssel éri el az egyik proci a másikat és a memóriát."

    A cikkben szereplo rendszernel meg a hp 8 magos asztali gepe is jobb. (teszteltem egy ilyet linux alatt es egy specialis '4 monitoros oblivion tesztben' is, persze az utobbit nem hivatalosan munka kereteben hanem csak azert mert nem birtam ki hogy ne nezzem meg)

    ""Mig pc-n, xbox360-on csak ujra kell forditani a tobbszalu kodot es maris gyorsabb lesz, addig ps3-on minden ujra kell irni."
    Ez így nem igaz. Sokszor csak némileg kell átírni v. kiegészíteni, és Cellen jóval gyorsabb még így is, fele SPE kihasználtsággal (fejlesztő írta)."

    Kis adatkeszletnel ez igaz. Ha elfogy a 256KB (kilobyte!) akkor jonnek elo a gondok. Azert ez mar nem egy olyan nagy adatmennyiseg hogy egy fizikai modell ne tartalmazzon tobb adatot. (es meg a programnak is bele kellene fernie)

    ""Meg jo, hogy az nvidia gf8800-as sorozat mar altalanos cpu-kat kapott, amik akar a linux-ot is futtathatjak, bar memoriavedelem nelkul."
    Ez egy hülyeség."

    Probald ki! A linux eredetileg M68k-ra optimalizalt valtozata tokeletesen fut barmilyen memoriavedelem nelkuli rendszeren, bar driver nem nagyon lesz hozza, de vegulis csak egy shared memory alapu driver stack kell neki (csomag i/o alapu virtualis hardverekkel, amiket a kulso cpu kezel). Last nommu-s kernel. A kod egyszalu resze nagyon lassu lesz, de a parhuzamos feldolgozas sokat nyer a 128 maggal.

    ""es olyan programozok kellenek ra mint akik annak idejen c64-es meg amiga-s demokat irtak. Mara nem sok ilyen koder maradt"
    Jelen! :)"

    Van mar devkit-ed? Ha nincs vetess a cegeddel egyet es megerted miert kap hulyet tole a legtobb fejleszto.

    ""es a jatekkeszito cegeknek meg nem eri meg rendesen megfizetni oket."
    A multiplatformosoknak, akik egyszerű újrafordításdiban gondolkodnak..."

    Mutass egy ceget magyarorszagon ahol ps3 exkluziv fejlesztes van es eppen van felvetel rendes fizetessel... egyszeruen a ps3 exkluzivitas nem jellemzo a mai cegekre. Mindeki csak egyszer ir es sokszor fordit. Mondjuk ez az eladasok tukreben ertheto.

    Egyebkent meg en teljesen tisztaban vagyok azzal, hogyan lehetne jo kodot irni a cell-re. Jol szegmentalhato adatmodell kell, vektoros feldolgozas, manualis memoriakezeles, es buta, de gyors cpu-t igenylo algoritmusok. Az egyetlen gond, hogy egy ilyen kod nem futna jol mas cpu-kon. Ha egy ceg valaszthat, hogy fejleszt az osszes tobbire vagy ps3 exkluziv lesz, akkor az elsore fog tenni. Es meg tobbet is adnak el az osszes tobbi gepbol (pc, xbox360, wii) tehat tobb jatekot is fognak rajuk venni.

    ===Mas===
    "Pár napja a neten fenn volt egy interjú a cell tervező csoportjának "főépítészével". Rákérdeztek, hogy szerinte miért panaszkodnak a programozók az új architektúrára?
    Azt válaszolta, hogy ez a bonyolultabb architektúra sokkal több előzetes tervezést igényel. Ő különböző nagyságú vállalatokat hozott fel példának.
    Ha csak kicsi a vállakozás akkor mindíg van lehetőség, hogy az ember elugorjon a boltba cementért, vagy akármiért ha elfogyna, mert rosszul mért fel előzetesen valamit az ember. De egy nagy vállalat nem tud egyszercsak több tonna cementet előteremteni, ha a szükségleteket rosszul rosszul tervezték be."

    Itt a hasonlat az, hogy cell spe eseten csak 8 kis betonkevero van amiket kezzel kell megtoltni es kiuriteni, mig a masik ceg 3 nagy betonkevero teherautot ad, amik toltik es uritik is magukat. Melyikkel lesz konnyebb a munka es kell hozza kevesebb ember???

    Az edge konyvtarrol meg annyit, hogy nem eri el a directx szinvonalat, pedig ebben az esetben nincs tul magasan a lec. Majd jopar ev mulva mar lesz rendes tamogatas, de addigra elavul a cell. A hagyomanyos algoritmusok pedig cpu-tol fuggetlenul barhol jol fognak futni a jovoben is, mig a cell-re optimalizaltak csak a cell-eken.