• dez
    #57
    Nem a WLIV itt a lényeg, hiszen az R6xx is WLIV-s (illetve az főleg az), hanem a SIMD végrehajtás (de nem egy szálon belül, hanem mindegyik elem más-más pixelre/vertexre/stb. dolgozik), miközben az R6xx superscalar egységekből épül fel. Bár itt "SIMD Arrays"-nak nevezett tömbök épülnek fel belőlök, de ez csak annyit jelent, hogy egy ilyen tömb ugyanazt a programot hajtja végre, más-más pixelekre/vertexekre/stb., de minden superscalar egységnek van saját branch egysége.

    A 24 bites FP már az ATI/AMD-nél is a múlt, az R6xx óta. De nem tudom, hogy akár itt, akár Nvidiánál ez a filteringre is vonatkozik-e (amit leginkább a textúra-egységek csinálnak).

    "de akkor 1 orajel helyett kb. 50-100 orajelet igenyelve"
    Ez a gyakorlatban olyan, mintha nem tudná.

    "Mashol mar leirtam, de az igazan jo megoldas az altalanos processzorok bevezetese lenne."
    Mintha nem tudnád, hogy az Intel Larrabee-je pont ilyen lesz.

    "Ha a gpu magok altalanos skalar vliw processzorokkent mukodnenek (tehat 1 control unit, 1 aktiv szal alapon), akkor ki lehetne hagyni a jelenlegi texturakezelo es raster operation aramkoroket is"
    Nem egészen értem a kettő közötti összefüggést.

    "csak az alu-k szamat kellene kb. a duplajara novelni es minden szalnak sajat vezerloegyseget adni."
    Utóbbi annyival növelné meg a méretét, hogy nem hogy több, de még ennyi sem lehetne. A Larrabee-ben is csak kb. 24 mag lesz, egyenként egy SSE szerű egységgel.

    "(intel sse eseten ez csal 4)"
    Nem, az SSE egy szálon dolgozik, csak egyszerre 4 32 bites adattal (vagy 2 64 bites, vagy 8 16 bites).