philcsy#30
"Amit "shared memory"-nak hív az Nvidia azt a többi "local memory"nak. És úgy tudom hogy terminológiailag is ez az utóbbi a helyes.
Nem így van."
Szerintem félreértettél.
"AMD GPUs include a fast, high-bandwidth local memory for each work-group.
Local memory is shared among all work-items in a work-group." ATI STREAM COMPUTING(4.5)
"Local Memory: A memory region local to a work-group. This memory region can be
used to allocate variables that are shared by all work-items in that work-group." OpenCL(3.3)
"Each thread block has shared memory visible to all threads of the block and with the same lifetime as the block." NVIDIA_CUDA(2.3)
(DirectCompute-ot nem ismerem.)
Szóval mind a három lényegében ugyanarról a "memória tipusról" beszél, csak máshogy hívják.
A problémát bonyolítja hogy a klasszikus parallel programozásban (régebben 1 magos hagyományos CPU-s hállózatba kötött egységekből indultak ki) is használták/használják ezeket a kifejezések. Ott a "local memory"-t csak egy processzor éri el, a "shared memory"-t pedig a processzorok egy csoportja. Persze azóta sok minden megváltozott, de ezek a kifejezések elég megtéveszőek lehetnek.
Remélem így már érthető mire gondoltam.
"Amikor meg az ATI specifikációban azt olvastam hogy "wawefromt" azt sem tudtam hogy eszik-e vagy isszák.
Szinte biztos, hogy egy wavelet alapú codec-et támogató függvényre gondolsz. A mostani videó codec szinte kivétel nélkül FFT alapú, a wavelet a következő generáció (pl. Dirac), de egy nagyságrenddel számításigényesebb."
A föntebb linkelt ATI STREAM COMPUTING dokumentációban (1.3) résznél megtalálod milyen "wavefront"-ra gondoltam.