• dez
    #467
    "Nem is mondtam ilyet."
    -- Na nézzük, mit írtál:
    "Annál inkább kéne neki a többi kidobot fícsör (ebből a szempontból egy 386-oshoz hasonlít tudásban)."
    - LOL! A #445-ötösben leírtak alapján talán látod, ez milyen butaság volt... (Ráadásul hol volt HW SMT-s a 386?)
    "Plusz még ehhez jön a hosszú futószalag, ami már a P4-ek esetén egyszer csődöt mondott (a cell-t kb. akkor kezdték tervezni, amikor a p4 kijött)."
    - A P4 out-of-order rendszere miatt is hosszú a futószalag. Lehet, hogy a Cellé sem nagyon rövid, de tuti nem ilyen hosszú.
    "Egyébként pont az in-order működés miatt nincs meg az a párhuzamosítás ami máshol ezt megoldaná."
    - Ez meg teljesen értelmetlen: a PPE in-order-ességének semmi köze az SPE-k párhuzamos munkájához.

    "Megfelelően optimalizált kóddal valamennyire ellensúlyozni lehet, de nem teljesen."
    -- Itt meg magadnak mondasz ellent:
    dez: "[Párhuzamosítással közömbösíthető a hosszabb késleltetés.] Megfelelő (fordítóra bízható) optimizáció révén az in-order végrehajtás és a gyengébb branch-prediction is, többé-kevésbé, feladattól függően."
    BA: "A tapasztalat szerint nem igazán. Nem véletlen, hogy a PC-n is rengeteg tranzisztort áldoznak erre."
    - Nem mindegy, hogy "nem igazán", vagy "nem teljesen"...

    "Ami nagyobb gáz, hogy debug kódnál nincs optimalizáció, így az lassabb lesz, és nehezíti a hibakeresést."
    -- Miért ne lehetne optimizáció (nem optimalizáció!) ilyenkor is?

    "Ebben nem vagyok olyan biztos. A branch prediction inkább a hosszú futószalag, és a memória késleltetés ellensúlyozására való."
    -- Persze, csakhogy ezt nagyban megbonyolítja, ha egyfolytában átrendezésre kerül a végrehajtási sorrend! Ezért in-order rendszerű prociknál egyszerűbb is elég. És olyan van is a PPE-ben.

    "A magas órajelhez is hoszabb futószalag kell, márpedig a cell magas órajelen fog futni. Konkrétumot nem találtam, de az olvasottak alapján én viszonylag hosszúra tippelnék."
    -- Ez több tényezőtől is függ, mennyire hosszú kell neki. Egy RISC procihoz eleve rövidebb kell, és a RISC-ség miatt tudtak már korábban magasabb órajeleket elérni, mint a CISC-eknél (mint amilyen az x86).
    Továbbá az out-of-order rendszer is hozzátesz jópárat.

    "Természetesen. Pont az volt a cell-ben az ötlet, hogy az adott mennyiségű tranzisztorből bonyolult logika és nagy cache helyett sok egyszerű magot csináltak. Kétségtelen előnyei vannak ennek a megoldásnak, és valószínűleg ez a filozófia a jövő, de vannak hátrányai, és a cell még elég kezdetleges megvalósítás. ráadásul teljesen új programozási stílus kell hozzá, a mi jelenleg szintén hátrány."
    -- Ne keverjünk mindent ide, itt most csak a PPE-ről van szó. Ahhoz önmagában nem kell speciális programozási technika, csak mert in-order. (Csak a asm-ben kódolsz, általános kódot, ami már nem szokás.)

    "Az Itanium nem is lett sikeres."
    -- De nem emiatt nem.

    "Egyébként az Itanium egy órajel alatt 6 utasítást hajt végre"
    -- Persze, de ez már más téma. Többek között emiatt is jóval nagyobb.

    "a cell PPE-je csak kettőt (szálanként 1-et)."
    -- Ezt honnan szedted, hogy szálanként csak max. 1-et? Alapvetően 2-issue rendszerű, ami tudtommal azt jelenti, 1-szálon is 2 utasítást dolgoz fel ütemenként (más procikhoz hasonlóan akkor, ha más regisztereket és más szabad egységeket használ a 2. utasítás, mint az 1.). Az, hogy HW SMT-s, az egy ráadás: meg van duplázva a regiszter-készlet is, és bizonyos vezérlő egységek, így a 2. szál saját regiszter-készletet használ, ebből a szempontból nem zavarják egymást. Persze osztozniuk kell a rendelkezésre álló fő-egységeken (amik közül egyesek talán pluszban meg vannak duplázva).

    "Névleges teljesítményben lehet jó, de a kihasználása nehezebb."
    -- Egy jó fordítóval csak nem olyan nagy gond a PPE kihasználása...

    "Mert rengeteg tranzisztorjuk volt, amivel kvázi nem tudtak mit kezdeni. A megoldás az volt, hogy realtime kód optimalizálást, és automatikus párhuzamosítást építettek a procikba."
    -- No azért a korábbiakban még nem volt olyan olcsó a tranyó, és a cache-ekhez is kellett. Die méret...

    " "Nehezebb igazán optimális kódot generáló compilert készíteni hozzá."
    Pont hogy könnyebb, mert sokmindent megcsinál a proci.
    "Minden proci-típushoz/-generációhoz külön meg kell írni az ide vonatkozó részt."
    Pont hogy nem. Éppen ellenkezőleg, jobban tűtik a compilerek bénázását."
    -- Ha nem vetted volna észre, ezek a kijelentések a in-orderre vonatkoztak. Kicsit félreérthető volt, de ez értelemszerű.

    "Elolvastam. Gyakorlatilag ugyanazt mondja mint én, minden szempontból."
    -- Hát nem egészen, mert ő azt mondja, hogy nagyon is jó a Cell, csak nem hűbelebalázs módjára kell nekiállni dolgozni vele.