dez#57
Nem a WLIV itt a lényeg, hiszen az R6xx is WLIV-s (illetve az főleg az), hanem a SIMD végrehajtás (de nem egy szálon belül, hanem mindegyik elem más-más pixelre/vertexre/stb. dolgozik), miközben az R6xx superscalar egységekből épül fel. Bár itt "SIMD Arrays"-nak nevezett tömbök épülnek fel belőlök, de ez csak annyit jelent, hogy egy ilyen tömb ugyanazt a programot hajtja végre, más-más pixelekre/vertexekre/stb., de minden superscalar egységnek van saját branch egysége.
A 24 bites FP már az ATI/AMD-nél is a múlt, az R6xx óta. De nem tudom, hogy akár itt, akár Nvidiánál ez a filteringre is vonatkozik-e (amit leginkább a textúra-egységek csinálnak).
"de akkor 1 orajel helyett kb. 50-100 orajelet igenyelve"
Ez a gyakorlatban olyan, mintha nem tudná.
"Mashol mar leirtam, de az igazan jo megoldas az altalanos processzorok bevezetese lenne."
Mintha nem tudnád, hogy az Intel Larrabee-je pont ilyen lesz.
"Ha a gpu magok altalanos skalar vliw processzorokkent mukodnenek (tehat 1 control unit, 1 aktiv szal alapon), akkor ki lehetne hagyni a jelenlegi texturakezelo es raster operation aramkoroket is"
Nem egészen értem a kettő közötti összefüggést.
"csak az alu-k szamat kellene kb. a duplajara novelni es minden szalnak sajat vezerloegyseget adni."
Utóbbi annyival növelné meg a méretét, hogy nem hogy több, de még ennyi sem lehetne. A Larrabee-ben is csak kb. 24 mag lesz, egyenként egy SSE szerű egységgel.
"(intel sse eseten ez csal 4)"
Nem, az SSE egy szálon dolgozik, csak egyszerre 4 32 bites adattal (vagy 2 64 bites, vagy 8 16 bites).