dez#467
"Nem is mondtam ilyet."
-- Na nézzük, mit írtál:
"Annál inkább kéne neki a többi kidobot fícsör (ebből a szempontból egy 386-oshoz hasonlít tudásban)."
- LOL! A #445-ötösben leírtak alapján talán látod, ez milyen butaság volt... (Ráadásul hol volt HW SMT-s a 386?)
"Plusz még ehhez jön a hosszú futószalag, ami már a P4-ek esetén egyszer csődöt mondott (a cell-t kb. akkor kezdték tervezni, amikor a p4 kijött)."
- A P4 out-of-order rendszere miatt is hosszú a futószalag. Lehet, hogy a Cellé sem nagyon rövid, de tuti nem ilyen hosszú.
"Egyébként pont az in-order működés miatt nincs meg az a párhuzamosítás ami máshol ezt megoldaná."
- Ez meg teljesen értelmetlen: a PPE in-order-ességének semmi köze az SPE-k párhuzamos munkájához.
"Megfelelően optimalizált kóddal valamennyire ellensúlyozni lehet, de nem teljesen."
-- Itt meg magadnak mondasz ellent:
dez: "[Párhuzamosítással közömbösíthető a hosszabb késleltetés.] Megfelelő (fordítóra bízható) optimizáció révén az in-order végrehajtás és a gyengébb branch-prediction is, többé-kevésbé, feladattól függően."
BA: "A tapasztalat szerint nem igazán. Nem véletlen, hogy a PC-n is rengeteg tranzisztort áldoznak erre."
- Nem mindegy, hogy "nem igazán", vagy "nem teljesen"...
"Ami nagyobb gáz, hogy debug kódnál nincs optimalizáció, így az lassabb lesz, és nehezíti a hibakeresést."
-- Miért ne lehetne optimizáció (nem optimalizáció!) ilyenkor is?
"Ebben nem vagyok olyan biztos. A branch prediction inkább a hosszú futószalag, és a memória késleltetés ellensúlyozására való."
-- Persze, csakhogy ezt nagyban megbonyolítja, ha egyfolytában átrendezésre kerül a végrehajtási sorrend! Ezért in-order rendszerű prociknál egyszerűbb is elég. És olyan van is a PPE-ben.
"A magas órajelhez is hoszabb futószalag kell, márpedig a cell magas órajelen fog futni. Konkrétumot nem találtam, de az olvasottak alapján én viszonylag hosszúra tippelnék."
-- Ez több tényezőtől is függ, mennyire hosszú kell neki. Egy RISC procihoz eleve rövidebb kell, és a RISC-ség miatt tudtak már korábban magasabb órajeleket elérni, mint a CISC-eknél (mint amilyen az x86).
Továbbá az out-of-order rendszer is hozzátesz jópárat.
"Természetesen. Pont az volt a cell-ben az ötlet, hogy az adott mennyiségű tranzisztorből bonyolult logika és nagy cache helyett sok egyszerű magot csináltak. Kétségtelen előnyei vannak ennek a megoldásnak, és valószínűleg ez a filozófia a jövő, de vannak hátrányai, és a cell még elég kezdetleges megvalósítás. ráadásul teljesen új programozási stílus kell hozzá, a mi jelenleg szintén hátrány."
-- Ne keverjünk mindent ide, itt most csak a PPE-ről van szó. Ahhoz önmagában nem kell speciális programozási technika, csak mert in-order. (Csak a asm-ben kódolsz, általános kódot, ami már nem szokás.)
"Az Itanium nem is lett sikeres."
-- De nem emiatt nem.
"Egyébként az Itanium egy órajel alatt 6 utasítást hajt végre"
-- Persze, de ez már más téma. Többek között emiatt is jóval nagyobb.
"a cell PPE-je csak kettőt (szálanként 1-et)."
-- Ezt honnan szedted, hogy szálanként csak max. 1-et? Alapvetően 2-issue rendszerű, ami tudtommal azt jelenti, 1-szálon is 2 utasítást dolgoz fel ütemenként (más procikhoz hasonlóan akkor, ha más regisztereket és más szabad egységeket használ a 2. utasítás, mint az 1.). Az, hogy HW SMT-s, az egy ráadás: meg van duplázva a regiszter-készlet is, és bizonyos vezérlő egységek, így a 2. szál saját regiszter-készletet használ, ebből a szempontból nem zavarják egymást. Persze osztozniuk kell a rendelkezésre álló fő-egységeken (amik közül egyesek talán pluszban meg vannak duplázva).
"Névleges teljesítményben lehet jó, de a kihasználása nehezebb."
-- Egy jó fordítóval csak nem olyan nagy gond a PPE kihasználása...
"Mert rengeteg tranzisztorjuk volt, amivel kvázi nem tudtak mit kezdeni. A megoldás az volt, hogy realtime kód optimalizálást, és automatikus párhuzamosítást építettek a procikba."
-- No azért a korábbiakban még nem volt olyan olcsó a tranyó, és a cache-ekhez is kellett. Die méret...
" "Nehezebb igazán optimális kódot generáló compilert készíteni hozzá."
Pont hogy könnyebb, mert sokmindent megcsinál a proci.
"Minden proci-típushoz/-generációhoz külön meg kell írni az ide vonatkozó részt."
Pont hogy nem. Éppen ellenkezőleg, jobban tűtik a compilerek bénázását."
-- Ha nem vetted volna észre, ezek a kijelentések a in-orderre vonatkoztak. Kicsit félreérthető volt, de ez értelemszerű.
"Elolvastam. Gyakorlatilag ugyanazt mondja mint én, minden szempontból."
-- Hát nem egészen, mert ő azt mondja, hogy nagyon is jó a Cell, csak nem hűbelebalázs módjára kell nekiállni dolgozni vele.