23001954630.jpg\"


Az nVidia G90-sorozat
  • Abu85
    #82
    Azt nem értem miért vitatkozol, amikor ilyeneket írsz. Már miért lenne érdeke egy fejlesztőnek előnyben részesíteni az egyik cég kártyáját. A HL2 nagyon jól futott GF6-on. Állítom, hogy a GF FX-re volt a legjobban optimalizálva a Source. Ne azt nézd, hogy lassan futott az FX-en, hanem azt, hogy miből hoztak ki akkora sebességet.
    Gondolom te is tudod, hogy az Fx Pixel Shader processzorának (az nV35-től) a felépítése egy Skalár FP16/32-es MAD Alu (2 darab Texturázóval)->2 darab FP32-os skalár Alu/Comb.(MUL/ADD/FP16-MAD). Ez a rendszer ált szemben az R300 féle FP24-es Vec3+skalár(MAD)-Vec3+Skalár(MUL)(1 darab Texturázóval), 3+1 co-issue. Nem tudom mit vártál az FX-től, de az elejétől lehetet sejteni, hogy a Shader feldolgozásban borzasztóan kevés lesz. Az FX a driverekben azzal játszot, hogy a Shader precizítást lecsökkentette 16bit-re és ezzel lehetett a mini ALU-k FP16-os MAD utasítását használni.
    Hasonlóan eltérő az R600 és a G80 Unified Shader procik felépítése. Az R600 egy SP blokkjában 4 FP32 skalár Stream processzor(MAD)-1 FP32 stream/SFU van, 1+1+1+1+1 véletlen utasítású co-issue. A G80 SP blokkjának felépítése 4 darab FP32 FP32 skalár Stream processzor(MAD+MUL)-1 FP32 SFU (4 órajel/utasítás), mindebből kettő csoport párhuzamosan kötve. Már most látszik, hogy a D3D10-ben bevezetet trigonometrikus és transzcendens utasítások a G80-on 4 órajel alatt hajtódnak végre az SFU-n. Ettől eltekintve mindkét rendszer 4 darab skalár MAD stream procis. Azonban a gyorstárak elérése és elrendezése közel sem egyforma. A G80 minden futószalagján külön gyorstárakat használ ami korlátozza az adatok méretét, többek közt ez az oka a gyenge Geometry Shader teljesítménynek. Az R600 közös gyorstárat használ mégpedig a 80 utas SIMD tömbök mellett (R/W memory cache). Nyilván a legkevesebb adatot a Fragment számítás követeli, míg a vertex és főleg a vertex tömb már igen nagy helyigénnyel rendelkezhet. Mivel a G80-ban nincs elég gyorstár hely a memóriát kell használni ami viszonylag magas elérési időve címezhető ugyebár. Innentől gondolom már látható, hogy miért nem a G80 az erősebb a shader teljesítményben, helyenként siralmasan gyenge.