• dez
    #60
    Minek pofázol bele, ha csak messziről szagolod a témát, és 1-2 alapfogalom szintjén el is akadsz?

    Leírok pár dolgot, meglátjuk, te mennyit értesz meg belőle...

    1. Az in-order végrehajtás nem a világvége, ahogy egyesek be akarják állítani. Mondok neked még pár in-ordres procit: UltraSPARC, Itanium (2), Crusoe, POWER6, Larrabee... Az összes GPU. És mellesleg a Xeonon is.
    2. Az in-order végrehajtás jó részt kompenzálható megfelelő optimizálással (akár egy fordítóban). Ma már jobb technikák állnak rendelkezésre erre, mint régen. Az out-of-order végrehajtás részben éppen a gyenge optimizálást volt hivatott ellensúlyozni. (Persze vannak esetek, amik nem tartoznak ide.)
    3. Miért éri meg ma is in-orderes végrehajtást csinálni? Mert sokkal kisebbek lehetnek így a magok, miáltal több mag fér el, stb.
    4. Az in-orderesség inkább csak a PPE-nél (a fő procimag, főleg általános kódvégrehajtásra) számít, és az sem full in-order, 1-2 utasítás mélységben fel tudja cserélni a végrehajtást. Ez általánan meg is oldja azokat a bizonyos kivételes eseteket, amit a fordító nem tud.
    5. A SPE-knél nem igazán számít az in-orderesség, hiszen egyrészt többnyire nem általános kódot futtat, plusz nem a lassú külső memóriból dolgozik, nem kell állandóan arra várnia, mint egy in-orderes procinak kellene rossz esetben.

    Még az adatokat sem tudod jól, mert egy 3.2 GHz-es Cell peak értéke 230 GFLOPS, és az IBM ennek 90%-át tudta kihozni valós kódokkal. És ez még nem minden. A belső felépítés következtében sokkal hatékonyabb a Cell, mint mondjuk egy GPU, ha a kód kicsit is közelebb áll az általánoshoz, mint egy sima shaderhez: a Cell 5x gyorsabb, mint egy 2x akkora elméleti peak értékkel rendelkező G80! (Egy Opteronhoz képest - valószínű egymagosról van szó - meg 30x...) G80 vs. Cell

    Valóban, ez a dolog a matematikai számítási teljesítményre vonatkozik. Arra nagyon is igaz, hogy 16-32 x86 maggal ér fel, tehát matematikai számítási teljesítményben. Nos én eddig is erről beszéltem, nem másról, sőt ki is emeltem. Úgyhogy felesleges is volt az egész hozzászólásod...

    Azonban annyira nem veri oda a Cellt általános kódban sem egy átlagos x86, mint gondolod. Ugyanis, a számításigényesebb részek SPE-kre való átruházásával a PPE-nek máris kevesebb a dolga. És mellesleg 6-8 SPE is tud általános kódot végrehajtani, csak kisebb hatékonysággal.

    A PS3 Cell butítása ennyi: egy mag le van tiltva, egyet meg a rendszer használ különféle feladatokra.

    Igenis, a Cell matematikai számítási teljesítménye a Xenon többszöröse. Ez tény.

    El fogom olvasni, amit linkeltél, meglátjuk, vajon ez is csak a szokásos FUD, ír-e olyat, amit eddig nem tudtunk, stb.