• ozric
    #29
    Az érdekes lenne ha a többihez is hozzá lehetne férni. Bár nem tudom mire lehetne használni.

    Hozzá lehet férni, csak nem publikus a módszer (csak NDA alatt érhető el). Egyedi meghajtókat lehetne írni a segítségével. Néhány CAD szoftver a mostani kártyákhoz (Quadro, FirePro) tartalmaz céloptimalizált egyedi meghajtót, és nem OpenGL vagy DirectX alatt működnek.

    Amit "shared memory"-nak hív az Nvidia azt a többi "local memory"nak. És úgy tudom hogy terminológiailag is ez az utóbbi a helyes.

    Nem így van. Az nVidia local memory nevet a regiszterekre alkalmazza (1024 db van magonként, de ez kicsit mixelt), de használatos az L1 memory név is. A shared memory a blokk memória neve, ennek is sok neve van, ez a másodszintű (Fermi: 64kB). A harmadszintű a globális memória, lényegében ez a grafikus processzor melletti memória (1-2 GB). Az nVidia lazán DRAM-nak hívja. Van még negyed szintű is, ez a host memory, ami a CPU mellett van. Az összes szint független egymástól, egyik sem gyorstár. Viszont a drága nVidia bevezette az L1 és L2 nevű (félkoherens) cache-t, ami a második és harmadik szinten található. Az OpenCL azért jobb, mert ott nem kell mindevvel törődni, a CUDA bonyolultabb de hatékonyabb.

    Amikor meg az ATI specifikációban azt olvastam hogy "wawefromt" azt sem tudtam hogy eszik-e vagy isszák.

    Szinte biztos, hogy egy wavelet alapú codec-et támogató függvényre gondolsz. A mostani videó codec szinte kivétel nélkül FFT alapú, a wavelet a következő generáció (pl. Dirac), de egy nagyságrenddel számításigényesebb.