• BiroAndras
    #229
    "a teljesen általános (nem csak számítási) feladatok egy része (sok fajta számítási feladat, és néhány egyéb feladat) igenis megvalósítható a GPU programozható részével. Tehát ha az egész nem is, egy része jelent valamit."

    De amikor általános feladatról van szó, akkor arra gondolunk, nem speciálisra. Hiába van benne az is, nem arról beszélünk.

    "Ez is csak félig igaz, ugyanazért, mint fent."

    Ez teljesen igaz, mivel nem azt mondja, hogy semmire se jó a flops, hanem azt, hogy nem csak az számít.

    "De ez akkor is hiányos, mert nem tárgyalja külön a számítási teljesítményt (pedig a FLOPS-kérdésről szól a fejezet)"

    De tárgyalja a "What about all those Flops?" című részben.

    "és ennek keretében a programozható részt, aminek a teljesítménye (flops-a) sokmindenre bevethető."

    A GPU flops-a érdektelen, mivel az grafikát fog számolni.

    "Akkor azt se hagyjuk ki, hogy sok esetben meg a GPU prog. egységeinek teljesítménye egyenesen földbe döngöl egy CPU-t!"

    Igen, de csak a neki való feladatoknál.

    "Az közismert, hogy a FLOPS nem egy teljesen egzakt teljesítmény-mérő szám, mint ahogy pl. a MIPS sem, meg a többi, amiket használni szoktak, de azért mégiscsak jellemzi a teljesítményt."

    Pontosan erről van szó. Jellemzi a teljesítményt, de cask bizonyos feladatoknál, és csak közelítőleg, és csak akkor, ha az architektúra többi része nem fogja vissza (pl. memória).

    "Tehát, az addig igaz, hogy az össz. GPU flops-át (beleértve tehát a fixen grafikai részeket) összeadni egy CPU flops-ával kissé marketing-szagú"

    Erről van szó. Bár a cikk még ennél is kevesebbet állít, miszerint ez az összeg az általános teljesítményt nem jellemzi jól.

    "de a programozható rész flop-a már, elviekben (a flops amúgy is elméleti dolog), már értelmesebb."

    Értelmesebb, de még az se teljesen ugyanaz, mint egy CPU flops.

    "Főleg, ha azt is tekintetbe vesszük, hogy itt a CPU egy Cell... (Aminél megintcsak feladat-függő, mennyi lesz az effektív flops, de igazából még egy x86-os CPU-nál sem lehet mindig kihozni a max-ot [sőt, valami miatt eleve maximum csak a felét lehet az elméletinek].)"

    Pontosan erről van szó. Annak van értelme, hogy egy-egy jellemző feladat esetén mekkora a teljesítmény. Az elméleti teljesítményt, és a szintetikus tesztek eredményeit már jó ideje csak tájékoztató jellegűek. A valódi teljesítményt valós alkalmazásokkal szokták mérni.

    "Mármint hogy a GPU flops-ainak egy része viszonylag szabadon használható."

    Konzolon nem, mert csak egy van belőle, és az grafikát számol.

    "Nem pedig úgy beállítani, hogy az egész GPU "felejtős" ilyen szempontból."

    Ezt sehol nem mondja a cikk (és én se).

    "Ha nagyon össze akarjuk adni (az össz. GPU flops-ot véve), összeadhatjuk, csak akkor persze a kijött számról tudni kell, hogy a nagy része a grafikára fog menni."

    Vagyis értelmetlen, mert nem mond semmit arról, hogy mennyi teljesítmény jut ebből a nem grafikai számolásoknak.

    "Ami a programozható részt illeti, a játék shaderezettsége függvényében maradhat egy kis ki nem használt teljesítmény."

    A játékok ismeretében ez teljesen valószínűtlen.

    "Főleg ha kihasználják a dual-threadet, márpedig egy játékban azért akkor is ki lehet valamennyire, ha a főmotor 1-threades, mivel van még mellette jópár feladat."

    Mennyit gyorsít ez?

    "Ez oké. Pl. a fizikai libek eleve egy SPE-n futnak"

    Nem erről van szó, hanem a gamelogic-ról.

    "Ha nem mp-enként 1000x akarod ezt megtenni, nem jelent gondot..."

    De pont azt akarom, azért mondtam rövid számolást. Ha a rövid számolásból nincs sok, akkor nem érdemes vacakolni vele.

    "Nem eleget? Hogy lehetne még ennél is többet?"

    Pl. úgy, hogy nem csak két kevésbbé lényeges állításról beszélsz, hanem a többiről is (van bőven).

    Egyébként ez folytatása egy másik cikknek. Érdemes lenne azt is megnézni, de nem sikerült megtalálnom.