ozric#47de nem fog roszabbul teljesíteni semmiben az szinte 100%.
Erre ne fogadj, az ördög a részletekben lakozik. Hatalmas mumus a GPU programozásnál a címzés és a load/store (a 4 szintű memória miatt), viszont a Fermi képes univerzális mutató kezelésére (lásd C++/egyesített címtér rész), amiről még nem sokat tudni. Valami hasonló dolog lesz, mint CPU-nál a virtuális/fizikai címfordítás, aminek a költsége 0 (zéró) órajel. Ha az nVidia mágusai alacsonyan tudják tartani az órajel költséget, akkor a kernel kód lényegesen rövidülhet a fél-koherens L1/L2-nek köszönhetően. Azaz kisebb és gyorsabb lehet a kód mint az ATI kártyáknál komplex, dinamikus vagy nehezebben párhuzamosítható algoritmusok esetén. Ha meg magas (>20), akkor csak egy kirakat funkció lesz, a következő generáció demózása. Újabb gyorsulás lenne, ha meg az L2-k (grid-ek) között lehetne közvetlen adatcsere, nem kellene annyit feleslegesen szinkronizálni. Viszont a Fermi sok adatintenzív és aszietrikusan párhuzamos (pl. vágás) DirectX funkciót nem fix áramkörrel old meg, nem véletlenül nyilatkoznak rettenetesen óvatosan a teljesítményről.