168
  • mir
    #121
    ,,TALÁN most a cell-nek sikerül..''
    NEM LEHET MEGERTENI??? A CELL NEM VERSENYTARSA EGYETLENEGY X86 PROCESSZORNAK SEM!!!
  • Vers
    #122
    hát nem az biztos, én sem merném szembe állitani a kettöt, olyan lenne minntha egy trabant meg egy ferrari küzdene az elsöségért:)
  • mir
    #123
    olyan, mintha osszehasonlitanal egy ferrarit egy traktorral:
    a ferrari nagyongyors, nagyonszep, de budapesten felul az elso uthibara, es ha szantani kell (ergo nem jatszani) akkor kitorolheted vele. altalanos celu muveleteket tekintve az a PPC mag JOVAL gyengebb, mint az x86osok, es azert nem versenytarsa, mert nincs olyan piaci szegmens, ahol mind a ketto jelen lenne.
  • Vers
    #124
    na most már tényleg érdekelne honnan vetted hogy nem olyan gyors a ppc mag mint egy x86-os szutyok?
    5.6 ghz-ig müködik a ppc mag a cellben,saját vectorprocesszorral(VMX,altivec) 512 kilo L2 cachel
    ha most a dupla cores intelekkel akarnál jönni elárulom hogy a ps3-ban 2 ppc mag lesz egy a gpu-ba is kerül :)

    várom az objektiv válaszod tisztelettel:)


  • Vers
    #125
    "mert nincs olyan piaci szegmens, ahol mind a ketto jelen lenne."

    egyetértek, de ez változhat, akár hirtelen is..
  • Vers
    #126
    ez is a m$-on mult mert x86 helyett ök is ppc-t fognak használni a nextgenükbe, számomra ez egyértelmü bizonyiték az x86 hulladékságára
  • mir
    #127
    azert, mert a mac-ekben meg G5osok mennek mindog, pedig PPC az is, meg ez is. sot, meg a G4eseknel is lassabb, mert ha nem lenne, akkor mar regen egy ilyen PPC magot tartalmazo powerbookot arulna az apple, es nem G4est. (a G5 sokat fogyaszt)
    ha az a PPC mag gyors lenne, akkor mar regen azt nyomna az IBM nem a G5ot. de nem gyors, annak csak az a celja, hogy kiszolgaljon egy halom vektorprocesszort. hiaba a nagy orajel, a pipe valoszinuleg el van nyujtva, h menjen ilyen sebesseggel, es valoszinuleg eleg nagy ugras van a PPC es a mikrokod kozott, sok a lebontando utasitas.
    es a PPC mag nem meg 5.2 GHzen, csak a SPE magok.
  • shabba
    #128
    A ferrari, traktor jó példa. De azért az szerintem sem igaz hogy a PPC hw-ileg gyenge lenne, a sw ellátottság terén van nagy hátrányban. Pl. ha cell-lel futatnál oracle-t akkor csak a PPC-k lennének használva a vektoregységek nem jellemző. Azért a dual mag és többprocis kialakítás itt is kihasználható, bár oda nagyobb cache-ek azért nem ártanának. Persze egy oracle elég nagy volumenű proggy hogy megérje átportolni több platformra, kisebb proggyknál már közel sem ilyen szerencsés a helyzet. Véleményem szerint ha lesz is némi migráció először csak a szerverek szintjén fog bekövetkezni ahogy a linux is ezt az utat járja végig. Kliens gépek szintjén még messze van egy drasztikus változás, már ha lesz egyáltalán.
  • mir
    #129
    sosem lesz Cellre Oracle, mert nem eri meg az oraclenek, SOKSZOR annyiba kerul egy oracle licensz, mint egy PS3, mashol meg nem lesz Cell, de ha lenne Cell bovitokartya, akkor is joval gyengebb lenne, mint az a gep, amit bovitenek vele, a Cell amugysem szerver-platform, 0redundancia, valoszinuleg a szalkezelese siralmas is, mert nincs ra szuksege. a Cell vektorszamitasokra jo, masra nem.
  • Vers
    #130
    "es a PPC mag nem meg 5.2 GHzen, csak a SPE magok."

    én is ezt hittem még 1 hete, de ugyanannyin megy mint a vectorprocik
    szoval hiába az elnyujtott pipeline meg bármilyen egyszerüsités, 2 utas lett a proci a g5-ös 4 utas, akkor is gyorsabb vagy minimum ugyanolyan gyors mint egy intel, amd proci
  • Vers
    #131
    én ugy fogalmaznék ugyanarra jo mint egy intel meg amd, de vectorszámitásban 1 nagyságrendet ráver
    csak annyi kell a cellnek hogy az apple a következö gépébe beletegye és máris ellenfele lesz a x86-nak, föleg ha olcso is lesz
  • mir
    #132
    ahh latom el vagy tevedve.
    1 az egesz 4.6 GHzen megy, csak a SPE magok kepesek 5.2re is.
    2 a G5 lassabb, mint a jelenlegi csucs x86osok.
    3 latom nem erted, hogy mi a problema a konzervativ koddal, es enm most nem fogok neked kis ertekezest irni, ahol elmagyarazom, hogy a 4.6 GHz elerese erdekeben a bikahosszu Pipe es a nagyon alacsony szintu mikrokod miatt a legegyszerubb utasitasok vegrehajtasi ideje is 30-40 ciklusra emelkedik MINIMUM, de a bonyolultabb utasitasok tobb100 orajelet is igenybe vehetnek, tobbszorosen megszegyenitve ezzel meg a prescottokat is, pedig az csak 30 lepcsos, es egy Cisc utasitaskeszletet implemental.
  • shabba
    #133
    Az átlad belinkelt pdf-ben vagy ilyen mondat: Ez nem jelenti azt hogya 4.6Ghz-es Cell PPE túlteljesítené a 3ghz-es G6-ot, de közelében van. Nem igazán ismerem a power procik terveit, de ha a cell egy mindent ütő valami lenne akkor:
    1. minek készülne el a G6?
    2. minek pedáloznának "nyomorék" 3Ghz-cel ha már 4.6-ot tudó ketyegőjük is van.

    Szóval ez is azt bizonyítja az általános célú procikat ugyanúgy fejlesztik mert szükség lesz rájuk.
  • mir
    #134
    draga lessz ez co-processzornak meg akkor is, ha mar ,,olcso'' lesz.
    azon kivul a SSE semmivel sem lassabb, mint a PPCs tarsai, csak x86hoz ottvan az intel compiler, brutalis vektor-optimalizacioval(nativ c* kodbol), olyannal, amiert a Sony meg az IBM meg be is csokolna az intelnek, de nem elado a technologia.
  • Vers
    #135
    figy akárhogy kavaraod is a szart :) csak nem azt akarod kihozni hogy a 4.6 ghz-en müködö ppc mag sokkal lassabb mint a 3.5 ghz-en müködö intel,amd csoda
    hasonlitsuk a memoriát? cellnél 25 GB/s, a buszt? cellnél 2 ghz-en megy 200 GB/sec az átvitele

    most komolyan nem vagy kicsit elfogult, de lehet én vagyok a hülye
  • Vers
    #136
    megmondom öszintén a cellnél sokmindenbe bele lehet kötni de a buszba nem az egy fantasztikus alkotás,akkora helyet foglal a die-on mint egy ppc mag 512 cachel, használtak már ilyen gyürü memoriát más prociba? én nem tudok rola
  • mir
    #137
    ,,figy akárhogy kavaraod is a szart :) csak nem azt akarod kihozni hogy a 4.6 ghz-en müködö ppc mag sokkal lassabb mint a 3.5 ghz-en müködö intel,amd csoda,,
    konzervativ kod eseten siman.

    ,,hasonlitsuk a memoriát? cellnél 25 GB/s, a buszt? cellnél 2 ghz-en megy 200 GB/sec az átvitele''
    A Cell memoraiajanak nagyon nagy a kesleltetese, ez csak RONT a cell helyzeten, ilyen memoriaval a PCk is lassabbak lennenek.

    ,,most komolyan nem vagy kicsit elfogult, de lehet én vagyok a hülye''
    ahogy tetszik, nem kell nekem hinni, HASZNALD A JOZAN ESZED, es tanulj alacsonyszintu programozast, ill. van a Tanenbaum fele szamitogep architekturak konyv, az is eleg jo anyag, es programozz le par100000 sort tobb platformon, es akkor majd lesz valami foglamad arrol, hogy hogyan mukodik a piac, es hogyan nem.
  • mir
    #138
    jo buszrendszer, nem kotottem bele. es a Cell is jo processzor, a sajat keretein belul, de sokmindenre NEM alkalmas.
  • Vers
    #139
    "tanulj alacsonyszintu programozast"

    a hozzászolásodbol ez tetszik legjobban, igaz hogy 20 éve ezzel foglalkozok,
    de nembaj nem vitatkozok veled feladom, nem jutunk közös nevezöre , majd ha lesz a cellröl pipeline docsi, vagy speedteszt folytathatjuk
    a hasraütés nem az én modszerem...
  • mir
    #140
    szerintem nem lesznek ilyen publikus infok a Cellrol...
    amugy bocs az inzultalasert, kicsit tulzasba vittem.
  • Vers
    #141
    nincs harag a vitatkoásba belefér egy kis érzelem is:)
    az SPU-rol már van pipeline docsim , nemsokára lesz a PPE-röl is
  • mir
    #142
    ha lesz a PPErol is, akkor dobj 1 linket ide!
  • Vers
    #143
    most még csak ennyi van a PPE-röl:

    The POWERPC Processing Element

    Neither microarchitectural details nor the performance characteristics of the POWERPC Processing Element were disclosed by IBM during ISSCC 2005. However, what is known is that the PPE processor core is a new core that is fully compliant with the POWERPC instruction set, the VMX instruction set extension inclusive. Additionally, the PPE core is described as a two issue, in-order, 64 bit processor that supports 2 way SMT. The L1 cache sizes of the PPE is reported to be 32KB each, and the unified L2 cache is 512 KB in size. Furthermore, the lineage of the PPE can be traced to a research project commissioned by IBM to examine high speed processor design with aggressive circuit implementations. The results of this research project were published by IBM first in the Journal of Solid State Circuits (JSSC) in 1998, then again in ISSCC 2000.

    The paper published in JSSC in 1998 described a processor implementation that supported a subset of the POWERPC instruction set, and the paper published in ISSCC 2000 described a processor that supported the complete POWERPC instruction set and operated at 1 GHz on a 0.25µm process technology. The microarchitecture of the research processor was disclosed in some detail in the ISSCC 2000 paper. However, that processor was a single issue processor whose design goal was to reach high operating frequency by limiting pipestage delay to 13 FO4, and power consumption limitations were not considered. For the PPE, several major changes in the design goal dictated changes in the microarchitecture from the research processor disclosed at ISSCC in 2000. Firstly, to further increase frequency, the per stage circuit delay design target was lowered from 13 FO4 to 11 FO4. Secondly, limiting power consumption and minimize leakage current were added as high priority design goals for the PPE. Collectively, these changes limited the per stage logic depth, and the pipeline was lengthened as a result. The addition of SMT and the two issue design goal completed the metamorphosis of the research processor to the PPE. The result is a processing core that operates at a high frequency with relatively low power consumption, and perhaps relatively poorer scalar performance compared to the beefy POWER5 processor core.
  • Vers
    #144
    még annyit hozzáfüznék hogy a PPE kevesebb müveletet hajt végre mint a g5 , ugyanakkora orajelen !, de a PPE majdnem dulpa akkora orajelen tud futni tehát valoszinü hogy gyorsabb annál, különben g5-öt raktak volna a cellbe

  • mir
    #145
    ,,and perhaps relatively poorer scalar performance compared to the beefy POWER5 processor core. ''
    ez itt a lenyeg.
  • mir
    #146
    a G5 nagy, sokat fogyaszt, es alacsony orajelen jar. asszinkron processzort tervezni nem egyszeru, meg akkor sem, ha 2 belso orajel lenne, igy a G5 visszafogna a vektor-egysegeket, amik lenyegesen egyszerubbek egy rendes magnal.
  • Vers
    #147
    heh? semmi köze a ppe orajelének a vectoregységekéhez, az orajel minden egységen folyamatosan szabályozhato

    szerintem azért döntöttek a 2 utas magasabb orajelü rendszer mellett , mert ennek kihasználásához nem kell több szálat inditani, könnyebb optimalizálni,talán forditot is könnyebb rá irni, és egy optimalizált kod egy 2 utas rendszeren száguld, mig egy 4 utason ezek sokkal bonyolultabb dolgok
  • Vers
    #148
    a g5 nem nagyobb mint a PPE mindegyik kb 25 milla tranyobol áll
  • Vers
    #149
    nemértem az orajelet mért nem veszed számitásba? a lényegen mindig átsiklasz :)
  • Vers
    #150
    ha választanod kellene egy 2.5 ghz-es 4 utas rendszer ami 4 utasitást dolgoz fel orajelenként és egy 5 ghz-es 2 utas rendszer között
    akkor melyiket választanád?
    én tuti a 2 utast
  • mir
    #151
    ,,heh? semmi köze a ppe orajelének a vectoregységekéhez, az orajel minden egységen folyamatosan szabályozhato''
    na eddig EZ maradt ki az eletembol...

    ,,a g5 nem nagyobb mint a PPE mindegyik kb 25 milla tranyobol áll''
    hm... nekem most mar ejszaka van, nem allok neki keresni, de nem tobb 1 kicsit az a G5? bar abban igazad lehet, hogy magas orajelu processzorra konnyebb hatekony programot forditani, mint alacsony orajelu, de tobbszorosen szuperskalar gepre.
    orajel: nem siklok at felette, tenyleg szep az a 4.6 GHz, de egyszer lattam egy 233 MHzes USparcot(II) framedropp nelkul AC3 hanggal Xvidet lejatszani 1280*1024ben FSAA-al, mikozben ez az 933as P3mamnak nem ment kicsit szkeptikus vagyok az orajellel kapcsolatban.

  • Vers
    #152
    az orajelállitás benn van az ibm szabadalmaiban ott olvastam, a visszafelé kompatibilitás miatt meg a skálázhatoság miatt

    a p3-nak azért nem megy mert cisc, elhiszem hoyg amit a c fordito lefordit ott a p4 g5 között nincs sok különbség, de ha egy jo programozo rászabadul a risc-re, akkor ott nincs pipeline stall, minden orajelben a 2 utasitás végrehajtodik, igy hozza az elméleti maximumot
  • Vers
    #153
    bár a g5-nél nem biztos a 4 utas rendszer nagyon megbonyolitja az optimizálást és nem valoszinü hogy sikerülne, de egy 2 utas rendszernél simán
  • dez
    #154
    Hiába domináns most az x86, ha egyszer számos, piacot uraló alkalmazásban már az a szűk keresztmetszet, és a(z amúgy egyátalán nem optimális) dual- és multi-core csak átmeneti szükségmegoldás lehet, és sem az Intel, sem az AMD nem tud csodát tenni. Itt már nagyobb teljesítménynövekedésekre van szükség.
  • dez
    #155
    Nem tudom, én ugyan nem számítottam akkoriban olyanokra. Akkor még volt kraft az x86-ban.
  • dez
    #156
    Hmm, neked PC = Windows? Korábban még így volt, de lassacskán szépen terjed a Linux. Ha még lendületet is kap a dolog...

    Nincs szoftver PPC-re? Egyrészt ott van a MacOS-X (aminek, ha jól tudom, vannak rokoni szálai a Linux-hoz, vagy talán OpenBSD-hez, nem tudom pontosan), de ugyanúgy van rá Linux is és más oprendszerek.

    (Talán nem tudsz róla, érdekességképp elmondom, pár éve lehet kapni nyílt szabványú G4 alapú alaplapokat, sokan használnak ilyet Linux alatt (miért ne alapon).)
  • dez
    #157
    Ez nem egészen így van. Kicsit több a Cell, mint egyszerűen egy proci+néhány SIMD mag. Ez egy levédett architektúra, amiben alapvető dolog a skálázhatóság. Mellesleg jópár éve fejlesztik, miközben az Intel puszta órajelnöveléssel volt elfoglalva. (Na jó, meg az Itaniumokkal.) Abból is látszik, hogy nincs ilyen téren tapasztalata, ahogy a dual-core-t megoldották (a lehető legegyszerűbben).
  • dez
    #158
    Mint elhangzott már, a Cell PPC magja a G6 deriváltja. Ami ráadásul megközelíti a nagytestvért teljesítményben. Lehet, hogy a G6 egy nagyszerű stand-alone proci, de a Cell jobban skálázható, és egyre több a vektoregységeket igénylő feladat. Lehet, hogy bizonyos munkakörnyezetekbe jobb lesz a G6 (vagy más hasonló hagyományos proci), de van egy csomó, ahova nagyon is jó a Cell.
  • dez
    #159
    "azon kivul a SSE semmivel sem lassabb, mint a PPCs tarsai"

    Ezt teljesen konkrétan tudod, vagy ez is afféle literated guess? Csak mert épp a napokban beszélgettem egy simd témában otthon lévő programozó sráccal a Cell-ről, és több dolgot is felsorolt, amiben gyengébb az SSEx, mint pl. az AltiVec. (Én még korábban az MMX-et hasonlítgattam össze az utóbbival mindenféle szempontból, hát magasan az AltiVec volt a nyerő.)

    "csak x86hoz ottvan az intel compiler, brutalis vektor-optimalizacioval(nativ c* kodbol), olyannal, amiert a Sony meg az IBM meg be is csokolna az intelnek, de nem elado a technologia."

    Akkor úgy tűnik, nem tudsz róla, hogy az IBM évek óta fejleszt egy compilert direkt a Cell-hez, és állítólag elég jó. (Bár kétségtelen, hogy az Intelé is igen jó.)
  • dez
    #160
    Csak nem azért emelik az órajelet, hogy közben lassabb legyen (nem csak per clock) a proci... :) Szerintem nem azért csinálják, mert véletlenül az Intel korábbi marketingesét szerződtették... :p