• dez
    #210
    A FLOPS-nak semmi köze a Wordhöz. Pont. :)
    Na mindegy, akkor nézzük (újra) azt az idézetet:
    "both floating point power numbers refer to the whole system, CPU and GPU."
    - Igen, eddig még igaz.
    "Obviously a GPU's floating point processing power doesn't mean anything if you're trying to run general purpose code on it and vice versa."
    - Nos itt kezdődik a hiányosság. Semmit semmiképp sem jelenthet, mivel az össz-flops-ban benne van a programozható, számításokra viszonylag szabadon használható rész is - és a teljesen általános (nem csak számítási) feladatok egy része (sok fajta számítási feladat, és néhány egyéb feladat) igenis megvalósítható a GPU programozható részével. Tehát ha az egész nem is, egy része jelent valamit.
    "As we've seen from the graphics market, characterizing GPU performance in terms of generic floating point operations per second is far from the full performance story."
    Ez is csak félig igaz, ugyanazért, mint fent.

    "Határozottan "general purpose code"-ról van szó, nem csak számítási feladatról.
    A mondás pedig az, hogy a CPU flops+GPU flops szám csak kis részét jellemzi a teljesítménynek."

    Oké, tegyük fel, hogy így értették. De ez akkor is hiányos, mert nem tárgyalja külön a számítási teljesítményt (pedig a FLOPS-kérdésről szól a fejezet), és ennek keretében a programozható részt, aminek a teljesítménye (flops-a) sokmindenre bevethető.

    "De flops igényes feladat is van, ami nem egyformán fut GPU-n és CPU-n. Pl. a GPU erősen párhuzamosított, és ha a feladat ezt nem támogatja, akkor máris elúszott a teljesítmény. CPU-n ugyanez sokkal kisebb gond. Másrészt a CPU-t sokkal könnyebb programozni, és ez is sokat számít."

    Akkor azt se hagyjuk ki, hogy sok esetben meg a GPU prog. egységeinek teljesítménye egyenesen földbe döngöl egy CPU-t!
    Az közismert, hogy a FLOPS nem egy teljesen egzakt teljesítmény-mérő szám, mint ahogy pl. a MIPS sem, meg a többi, amiket használni szoktak, de azért mégiscsak jellemzi a teljesítményt.

    Tehát, az addig igaz, hogy az össz. GPU flops-át (beleértve tehát a fixen grafikai részeket) összeadni egy CPU flops-ával kissé marketing-szagú, de a programozható rész flop-a már, elviekben (a flops amúgy is elméleti dolog), már értelmesebb. Főleg, ha azt is tekintetbe vesszük, hogy itt a CPU egy Cell... (Aminél megintcsak feladat-függő, mennyi lesz az effektív flops, de igazából még egy x86-os CPU-nál sem lehet mindig kihozni a max-ot [sőt, valami miatt eleve maximum csak a felét lehet az elméletinek].)

    És ha már a FLOPS-okról szólt az a kis fejezet, és szakmai elemzés akart lenni, ennek a dolognak szerepelnie kellett volna benne. Mármint hogy a GPU flops-ainak egy része viszonylag szabadon használható. Nem pedig úgy beállítani, hogy az egész GPU "felejtős" ilyen szempontból.

    "És persze a GPU grafikát számol, tehát a teljesítménye már előre le van kötve (hacsak nincs több belőle). Szóval az is áll, hogy a két flops érték nem adható össze simán."

    Ha nagyon össze akarjuk adni (az össz. GPU flops-ot véve), összeadhatjuk, csak akkor persze a kijött számról tudni kell, hogy a nagy része a grafikára fog menni. Ami a programozható részt illeti, a játék shaderezettsége függvényében maradhat egy kis ki nem használt teljesítmény. Mindenesetre ez inkább az x360 problémája, a ps3-ban ott van a Cell a számításokra.

    "Attól függ, hogy a sokkal egyszerűbb proci mennyivel gyengébb, mint egy átlag x86, és attól, hogy a feladatok mekkora részét lehet átrakni a PPE-kre." - SPE-kre - "Az első kérdés egyszerűen tesztelhető. A másik viszont sokkal bonyolultabb."

    Kiváncsi leszek az első tesztekre, de azt nem hiszem, hogy egy x86 teljesítményének töredékét hozná (általános kódban). Főleg ha kihasználják a dual-threadet, márpedig egy játékban azért akkor is ki lehet valamennyire, ha a főmotor 1-threades, mivel van még mellette jópár feladat. A második meg persze eset, ügyesség, és persze idő kérdése.

    "Mint már korábban is írtam, valószínűleg sokág csak a könnyen leválasztható részeket tudják átpakolni (kód komplexitásból kifolyólag)."

    Ez oké. Pl. a fizikai libek eleve egy SPE-n futnak, tehát az máris adott, használható, még csak nem is kell külön leprogramozni (csak a használatát :)).

    "Meg az is kérdés, hogy egy rövid számolás átadása egy SPE-nek mennyi idő. Mert ugye nem csak az adatot, de a kódot is át kell tölteni, és a szinkronizálást is meg kell oldani."

    Ha nem mp-enként 1000x akarod ezt megtenni, nem jelent gondot... Az idő töredékszázaléka.

    "Szóval összességében nem olyan szép és jó minden, ahogy azt a Sony meg az IBM állítja."

    Ezt senki sem gondolta.

    "De én remélem, hogy mindenki téved, és tényleg valami csúcsszuper cuccos lesz belőle."

    Nem kell "mindenkinek" tévednie, csak a túlzó kritikából kell visszavenni. Ha "mindenkinek" teljesen igaza lenne, a ps3 kvázi teljesen használhatatlan lenne. És ez a Sonynak (és hosszabb távon az IBM-nek is) nagyon rossz lenne, mert ugye a gépeladások csak viszik a pénzt, és a játékeladások hozzák.

    "Minek vacakolni a különválasztással, amikor épp arról van szó, hogy se egybe se külön nem számít."

    A GPU össz. és programozható részeinek flops-ának különválasztásáról van szó. Ennek értelmét csak nem vitatod.

    "És egyébként is mindenhol az egész van megadva, és mindenki az alapján mondja, hogy "húdenagyonjólesz"."

    Biztos vannak ilyenek, de hogy mindenki, azt kötve hiszem.

    " "és csak az az érvelés "nagyonis" korrekt, ami hiánytalan és egyátalán nem elfogult. Ez itt nem mondható el."
    Miért nem? Eddig még ezekről nem igazán beszéltél."

    Nem eleget? Hogy lehetne még ennél is többet?

    "Hogy lehet "úgy irkálni"?"

    Lásd alább.