dez#343
"Igen ítrtad, de én nem erre válaszoltam, hanem erre : "Itt nem az SPE-kről van szó, hanem a PPE-ről (CPU mag), abban van a (2?) VMX egység." "
Ott kezdődött, hogy azt írtad, nem-blokkos adattal nem tud kezdeni semmit az SPE. Pedig tud, csak ilyenkor be kell segítenie a PPE-nek is. Az egy másik dolog, hogy a PPE-ben is van VMX, így ő is tud számolni szépen.
"Egyébként meg az az alap működés, hogy a PPE irányít, de ez nem old meg minden problémát."
Hogy érted, hogy a PPE irányít? Az SPE akkor fér hozzá a külső ramhoz, amikor akar.
"Viszont nagyobb a késleltetése, hosszabb a futószalagja, sokkal gyengébb az optimalizáló logika, stb. (bővebben a cikkben). Összességében egy több generációval régebbi proci magasabb órajelen."
Párhuzamosítással közömbösíthető a hosszabb késleltetés. Megfelelő (fordítóra bízható) optimizáció révén az in-order végrehajtás és a gyengébb branch-prediction is, többé-kevésbé, feladattól függően.
PC-n egy játékban a prociidő többsége ugyancsak a megjelenítésre megy el, ide sorolva a fizikát is (vertex-adatok kezelése, atpumpálása a GPU-nak, stb.). Itt ezen feladatok jó részét átvállalhatják az SPE-k. Meg a lassan bejövő fejlettebb AI-t is. Így nagyon sok prociidő felszabadul!
Gondolj arra, hogy jópár éve, egy 7MHz-es, maiaknál jóval egyszerűbb procival rendelkező Amiga500-ra is eléggé összetett játékok is születtek. Az egyszerűbb grafika miatt kevesebb volt az ilyen irányú feladat is... Ehhez képest egy SMT-s 3,2GHz-es proci fergetegesen gyors.
"A memóri másolásokat meg hiába veszi át egy SPE, attól nem lesz gyorsabb (sőt, talán még lassabb is). És nem is a másolásról van szó, hanem kód futtatásról."
Miért lenne lassabb egy SPE másolásban? De nem az a lényeg, hogy esetleg lassabb-e vagy sem, hanem hogy nem a központi PPE-nek kell ezzel sem foglalkoznia.
Egy programban sokszor kellhet memóriát másolni.
"Kevesebb, mint egy közepes x86."
Egy tread esetén talán, 2 (x360-nál 6) esetén már nem biztos.
"Hiába, ha az SPE-dolgozna velük. Át kell tölteni az SPE-re a megfelelő blokkot, és ez lassú. Ha egy-egy blokkból csak kis részletekre van szükség, akkor a másolgatásra elmegy a teljesítmény nagy része. Ha meg a PPE-re túl komplex vezérlő logikát raksz, akkor annak a teljesítménye folyik el."
Tévedsz, a PPE apránként is küldhet adatot az SPE-knek, mivel hozzáfér a ramjukhoz.