dez#120"bármennyire is tiltakozol, ez igaz. Jó, talán egy kicsit eltúloztam."
Jahh, a kis túlzásod az volt, hogy 1-1 esetből általánosítottál. Ehhez képest én tudatosan kerülöm, hogy bármit válogatás nélkül hülyeségezzek.
"Nem, ezek inkább a kettő közt vannak. Egy-egy algoritmus megvalósításai"
Hagyjuk már az ilyen igazán értelmetlen akadékoskodást... Ezeket a feladatokat ilyen hatékonysággal végzi, pont. Ráadásul a PPE-t nem, vagy alig használja, azon futhat közben egy OS, tehát hétköznapi körülmények között is elérhetőek ezek a sebességek.
"ráadásul olyanok vannak összeválogatva, amikre optimális a cell."
Csahogy ezek a hétköznapokban is gyakran használt, nagy teljesítményt igénylő dolgok.
"Az mpeg lejátszás áll még talán a legközelebb egy valós alkalmazáshoz, de sok mpeg stream egyszerre lejátszása nem igazán életszerű."
Miről beszélsz? (Gondolom, a Toshibás demóról, de az egész más.) Itt 1db (különböző felbontású) mpeg2 stream dekódolása volt.
"Inkább bonyolultabb, műveletigényesebb feladatokkal kellene tesztelni, pl. mpeg4 stream készítés."
Nyilvánvalóan abban is elég jól szerepelt volna.
"Egyébként meg játékokkal kellene tesztelni (avgy ahhoz kapcsolódó feladatokkal), mivel hogy konzol chip-ről van szó."
Ezt már kurvára únom, hogy egyszer megbeszélünk valamit, te is egyetértesz/belátod, erre újfent előjössz vele, mintha kitörlődött volna a fejedből. És még te mondod nekem, hogy az én agyam read-only...
Szóval, NEM konzol chip, az csak az egyik alkalmazási terület.
Jó lenne, ha most már többször nem neveznéd konzol-chipnek.
Főleg, hogy épp arról próbálsz győzködni, hogy nem is igazán jó konzol-chipnek. Dumálsz össze-vissza.
"A felsorolt tesztek csak azt mutatják, hogy a cell mennyire jó DSP, vagy matematikai segédproci.
Igen, csakhogy a manapság főleg erre van szükség.
"Töb fejlesztő szeritn meg nem alkalmas. Tehát egyelőre nem tudjuk. Abbol fog kiderülni, hogy mennyi idő alatt jelennek meg a cell-t komolyan kihasználó játékok, és ezek mit fognak tudni."
Végső soron ez fog dönteni, de már most meg lehet nézni, ki mondja az egyiket, és kik a másikat. Meg azt is, milyen, mennyire túlzó vagy nem túlzó érveket mondanak, stb.
"Mint már mondtam, nemavgyok róla meggyőződve, hogy teljesen ptimalizált volt az a kód.
Ha nem hiszel a fejlesztőnek, higyj ennek az oldalnak, mivel innen van:
"Másrészt azt is mondtam, hogy a egyesített shader architektúra, és a DX10 együtt sokkal többre képes"
Önmagában tuti nem jelent 5x-ös gyorsulást.
"(pl. kevésbbé kritikus a GPU és a CPU közti sávszélesség)."
Az grafikában eddig sem volt kritikus. Te az CPU-t terhelő overheadról beszélsz, de az is csak 20%.
"Ezekre jó a CPU is, abban is van elég kakaó."
Nem, ha sok adatot kell párhuzamosan feldolgozni - de nem 1000x egymás utána, hanem vektoronként, és utána egy rövid ideig más kell csinálni, majd újra ezt.
"Mint már sokszor mondtam, a GPU-nak olyan feladatot kell adni, amiben az hatékonyabb.
Ilyeneket feleslegesen írsz le. De mint már ugyancsak beszéltünk róla, a fenti esetben (ami gyakori) meg van lőve a lassú buszon kommunikáló CPU+GPU páros, egyedül meg mindkettő gyenge hozzá (az egyik ezért, a másik azért). Érted?
"Jelenleg egy játék 1 CPU magon csinál mindent, ha hozzáadunk még 1 magot (mostanra már elég sok kétmagos van), és egy DX10-es GPU-t, akkor sokszorosára nő a valóban kihasználható teljesítmény.
Lehet, hogy egy CPU-hoz képest "sok", de általánosságban kevés.
"Plusz a DX10 magában egy csomó CPU időt felszabadít."
20% overhead-csökkenés van, plusz a geomerty-shaderezés a GPU-ban. Csakhogy geomertia-manipulásás nem is nagyon volt eddig.
"Nem, sokkal gyengébbek egy normál CPU-nál."
Nagyságrendekről beszéltem. Ha csak olyan lenne, mint egy (nem létező) 3.2GHz-es 68k, az sem rossz.
"És ezzeh jön még, hogy a memóriakezelésük is streaming jellegő feladatokra van kitalálva."
Ne keverj össze mindent. Ez a main-memóriához való hozzáférésre vonatkozik. Itt most a local storage-ről van szó.
"GPU-n meg nem futtatunk általános célú kódot."
Sokszor hasznos lenne.
"Nem csak ezen múlik a sebesség. Az is sokat számít, hogy egy műveletet milyen gyorsan tud végrehajtani."
Természetesen a legtöbbet 1 ciklus alatt, mint a mai procik többsége. (Nem számolva az I/O műveleteket, amik itt ráadásul szintén 1-2 ciklusúak.)
"A branch prediction és az out-of-order végrehajtás sem csak a memória elérés lassúságát ellensúlyozza."
Tudom, de az az egyik legfontosabb feladata. A többit nagyrészt meg optimizált fordítással/kódolással is meg lehet oldani.
"Pont hogy nem. Adott idő alatt kevesebb munkát lehet elvégezni, tehát az eredmény rosszabb lesz.
Sok gyenge játék szerinted többet ér, mint akár harmad annyi nagyszerű játék? Szal, nem csak a mennyiség számít, a minőség is.