• sirpalee
    #85
    Lehet a gpu-k scalarok kód szemszögéből, de elsősorban atin nagyon figyelni kell arra hogy írod meg a kódod, mert nagyon képes párhuzamosítani. Az R6xx széria legnagyobb előnye, egyben a legnagyobb hátránya is. Nagyon képes párhuzamosan dolgozni, ha a fejlesztők optimizálnak rá, és megfelelő arányban használják a különböző egységeken futó utasításokat, de mivel egy halom gémnél ott az nvidia logo, ezért magas ívben szarnak rá... Sajnos.

    Gondolom olvastad a GDC2008-as doksikat, ott volt egy nagyon érdekes, a dx10-es optimizációknál, érdekes volt ahogy az atis trükkök és az nvidiás trükkök egymás mellett voltak... NVidia : ne használd a geometry shader csak ha muszáj, ATI : nyugodtan használd, van ott jópár "ingyenes" órajel...

    Tegnap este olvasgattam, és akkor bukkantam rá, hogy az spe-k képesek a videó ramhoz hozzáférni (ha jól emlékszem az sramon keresztül), a fizikával kapcsolatban, nem hiszem hogy teljes, tényleges renderelésre kerülő vertex buffereken dolgoznak (vagy éppen amilyen formátumba töltik fel) az spe-k az kissé pazarlás lenne, bár ez csak apróság :) .

    Az tény, hogy a cell-ben nagyobb a potenciál mint a Xenonban, de Xenonra egyszerűbb programozni, és emiatt sokan választják elsődleges platformnak. Nagyjából hasonló a jelenség mint az ATI R6xx és G80/G92 között (max ott kevesebb eltérés van).

    Amúgy IBM hoz ki a cell-ből újabb változatot a közeljövőben (pl több spe)? Mert remélhetőleg nyár végefelé itt vannak az 1 TFlopsos GPU-k.