513
  • dez
    #433
    (BiroAndrasnak: tehát lehetni lehet, csak épp nehézkes.)
  • [Jakuza]
    #432
    Te mar megint mirol beszelsz ?
    Az nem tetszik, hogy 356 Gflops a Pixel Shader teljesitmenye a 7900XTnek 550 MHzen nem 400 ?
    Oreg a te allitasod a marhasag, hogy a Cell nagyobb teljesitmenyu, nem az hogy nem pontos adatot irtam le.
    Kar erolkodnod, a Celles allitasod egy baromsag, aztan beszelhetsz amit akarsz.
  • dez
    #431
    Nem az volt az igazi nagy marhaság, amikor jöttél itt az összteljesítménnyel, holott a shaderek teljesítményéről volt szó???

    Én csak egyszerűen nem voltam naprakész az adatban, de nem kevertem a gizikét a gőzekével, mint te.

    És akkor most már olvasd is el az Nvidiás doksikat: feketén-fehéren leírják, hogy nagyon kötött ez a környezet, és nehéz vele általános célú számításokat végezni, ilyen programot írni. Ezért a Cell még mindig optimálisabb ilyen feladatra.
  • [Jakuza]
    #430
    MOndom te el vagy varazsolva teljesen, hogy a Cell tobbet tud mint a mai VGA-k Pixel shader Gflopsban.

    G70
    Pixel Shader
    ((4way x 2 Unità + 2 scalari) x 2 FPop) + 7 normalizazioni = 27 FPop/ciclo; 27 FPop x 24 Shader x 430MHz = 278.6GFLOPS
    Vertex Shader
    (4way+1scalar) x 2 FP operations(MADD) = 10 FP Op/ciclo; 10 FPop x 8 VS x 430MHz = 34.4GFLOPS

    G70@550Mhz
    Pixel Shader
    27 FPop x 24 PS x 550MHz = 356.4GFLOPS
    Vertex Shader
    10 FPop x 8 VS x 550MHz = 44GFLOPS

    Csak idezet toled:

    ""Egy jobb GPU flops-ban veri a cell-t."
    -- Relatíve szabadon felhasználható FLOPS-ban? Nagy tévedés, nézz utána. "

    Kar ragodnod ezen a kerdesen, ha marhasagokat mondasz, aztan masra akarod kenni, hogy neked van igazad.

  • dez
    #429
    Na persze pixel shaderének 200 GFLOPS-át, mielőtt még ebbe is belekötsz.
  • dez
    #428
    És most ha megengeded, szeretném folytatni a beszélgetést BiroAndrassal, az ilyen felesleges intermezzók nélkül.

    Ha még a G70 200 GFLOPS-át írtad volna be, annak még értelme is lett volna.
  • dez
    #427
    Amúgy meg nézd csak meg, mit írtam a #423-ban...
  • dez
    #426
    gpgpu.org
  • dez
    #425
    Nem tehetek róla, hogy a gpgpu.com-on (Nvidia site ez is) lévő doksik jó részében (amit eddig néztem) még csak a 6800-as ide vonatkozó adata található.

    De én legalább tudom, miről van szó, te meg itt jöttél az összteljesítménnyel.
  • [Jakuza]
    #424
    Mar ne haragudj te elolvasod a szamokat is vagy csak a kepeket nezed ? NV40 alias Gf6800 53 Gflops
    Utana a latod a 200 folotti adatokat is egy ev elteltevel a 7es szerianal ?
    Pontosan a te altalad emlitett NVIDIA GPU Pixel Shader GFLOPS-nal.
  • dez
    #423
    Az mondjuk szép teljesítmény, hogy a 6800-as (NV40) 53 GFLOPS-ához képest a G70 már 200 GFLOPS (gy.k. a pixel shader teljesítménye). De továbbra is igaz (az nvidiás doksikban is le van írva!), hogy ez erősen kötött környezet, és nehezen megvalósíthatók így az általános számítási feladatok. Így nehezebb vele a munka, mint akár a Cellel.
  • dez
    #422
    És? Már jópár hasonlót olvastam már Nvidiáéktól (lásd pl. link), egy évre visszamenőleg. Talán neked is el kellene olvasnod.

    Ajánlom figyelmedbe a 7. oldalon lévő táblázatot. Címe: "NVIDIA GPU Pixel Shader GFLOPS".

    Érted már, hogy itt nem az egész GPU teljesítményéről van szó, hanem a programozható shader egységekéről, amiken fizikát számoló shader fragment programokat futtatnak, a szokásos grafikai effektek helyett.

    Végre egyszer elismerhetnéd, hogy totál tévesen kötöttél belém.
  • [Jakuza]
    #421
    Akkor olvasgass csak es tanulj.
    GPU Physics
  • dez
    #420
    "Motivation: Computational Power
    • GPUs are fast…
    – 3 GHz Pentium4: 6 GFLOPS, 6 GB/sec peak
    – GeForceFX 6800: 53 GFLOPs, 34 GB/sec peak"

    Forrás:
  • dez
    #419
    Ez kérdés akart lenni? Mert akkor válaszolok: nem az egész GPU összteljesítményről van szó, minden fixfunkciós egységet is beleértve, hanem mint többször világosan le volt írva, a programozható shader egységek kvázi általános számításokra rendelkezésre álló teljesítményéről.
  • dez
    #418
    Jav.: a GF 6800 programozható shader egységeinek elméleti számítási teljesítménye 53 GFLOPS, nem 63.
  • [Jakuza]
    #417
    ATI Radeon X1900XTX
    Engine Clock: 650MHz
    Memory Clock: 1550MHz
    Memory Size/Type: 512MB GDDR3
    Process: 90nm
    Piplines: 16
    Pixel Shaders: 48 (3/pipeline)
    ALUs: 48 (1/Pixel Shader) (Expected-Could be wrong.)
    Vertex Shaders: >8 Vertex Shaders (10?)
    TMUs: 16
    ROPs: 16
    Dual Crossfire Compatible
    3DMark05 Score: 11692
    Pixel shader ops/sec.: 166 Billion
    TerraFLOPS: 1.1

    http://www.theinquirer.net/default.aspx?article=28954
    Igaz mas meresek szerint csak 553.8 Gigaflops, mig a 7900GTX 400 korul van.
    Az XTX850 PE is tud 200 Gflopsot.
  • dez
    #416
    Na akkor ide jön még egy hozzászólás, amit említettem, de most egy kis dolgom van.
  • dez
    #415
    "A kompromisszum az, hogy nem használják ki az új cucc minden képességét elsőre."
    -- Az egy másik kompromisszum, ne keverjük már össze-vissza a dolgokat.

    "Tényleg nem érted, vagy csak nem akarod érteni?"
    -- Értem, amit mondasz, csak nem értek vele egyet, fel tudod ezt fogni?

    "Azért nem tetszik neki, mert a gyakorlatban messze nem olyan erős, mint amilyennek reklámozták, és ráadásul nehéz programozni."
    -- A GFLOPS-t reklámozták, és megfelelően optimális esetben ki is lehet hozni. Ez tény. Továbbá az általános teljesítménye sem olyan rossz, mint hiszed. (Lásd erről köv. hosszászólásom.) Az tény, hogy nehezebb programozni, de valamit valamiért.

    "Ezt most komolyan nem értem. Kifogytál az értelmes válaszokból?"
    -- Mert egy felesleges és értelmetlen mondatodat visszautasítottam?

    "Nem hülyék, csak olcsó konzol chip-et kellet építeniük."
    -- Ez jó nagy tévedés.

    "És nincs vele akkora gond, csak éppen az messze nem igaz, hogy 20-30-szoros teljesítménye lenne egy PC-hez képest."
    -- FLOPS-ban nagyon is igaz, mást nem állított senki. Amúgy sávszélességben is eléggé odaver.

    "Viszont meg kell tanulni programiozni, ami időbe telik. Ezek miatt a PS3-as játékok nem fogják úgy megelőzn a PC-seket, mint ahogy azt sokan várják."
    -- Mondja egy ellenérdekelt, PC-s játékfejlesztő cég munkatársa...

    "Mire elkezdik rendesen kihasználni a cell-t, addigra elterjednek a 4 magos x86 procik, amik már bőven versenyképesek lesznek (pláne fizikai gyorsítóval támogatva)."
    -- Zöldség, már bocs. Hol van egy 4-magos x86 FLOPS-ban még a Celltől, nem beszélve a szűkös sávszélességről? A Physix meg elbújhat a Cell mellett.

    "Nem lustaság, hanem idő és pénz."
    -- Egy belevaló PS3-as játék sokszorosan visszahozza. Befektetés - nyereség.

    "A fejlesztők reakcióit látva én ebben nem hiszek."
    -- Egyelőre 1db fejlesztő. Mindjárt én is írok egyet, kicsit más a véleménye.

    "Nem érted. Úgy csinálsz, mintha még sose dolgoztál volna határidőre.
    Nekem is ugyanaz a munkám és a hobbim, mégis egész másképp állok hozzá. Kísérletezni otthon szeretek, veszélytelenül, határidők nélkül. A munkát gyorsan és biztonságosan kell elvégezni. Ráadásul nem én választom meg, hogy mit és mikorra kell csinálni."
    -- Ez akkor van, ha kissé idióta a főnök, és nem képes felmérni a végeredmény nagyságát, és az ahhoz szükséges befektetést. Találkoztam ilyenekkel, gyorsan le is léptem. Jobb helyeken nem diktatúra van (legalábbis a fő fejlesztők felé), hanem én mondom meg, mihez mennyi idő kell, vagy a főnök eleve tisztában van vele. (Köv. hozzászólásomban mutatok egy céget, ahol kicsit értelmesebben állnak hozzá.)

    "Mintha valami kompromisszumokról beszéltél volna az előbb. Itt pontosan erről van szó. Ha én játékot akarok fejleszteni, nem feltétlen a nyers teljesítmény a legfontosabb szempont."
    -- Nyilván más is számít. Pl. hogy mekkora bevételre lehet számítani egy ütős játékkal... A PS3 egy kicsit más pálya, mint a PC, ne felejtsd el.

    "Mondj valami olyat, amit nem lehet megcsinálni egy X2-vel és egy extra GPU-val."
    -- Nos ez is max. csak fele teljesítmény GFLOPS-ban, ráadásul kötöttebb és nehézkesebb is. És a másik, amit szintén mindig elfelejtesz: PS3-nál default adott, PC-nél egyeseknek van kategória.

    "Egy jobb GPU flops-ban veri a cell-t."
    -- Relatíve szabadon felhasználható FLOPS-ban? Nagy tévedés, nézz utána. A GF 6800 tud elméletileg (és itt igazán elméletileg, mert sok a kötöttség, pl. nincsenek regiszterek, stb. stb., lásd gpgpu.org) 63 GFLOPS-t. A Cell 200-nál is többet.

    "Másrészt egész jó fizikát lehet csinálni már egy átlagos egymagos CPU telejsítményének kis részével is. Szeritnem egy GPU teljesítménye bőven elég egyelőre. Még azzal se tudnánk mit kezdeni jelenleg."
    -- Nagyot fogsz majd nézni, ha meglátod, mi az igazi "fizika"... :)

    "Látod, erről beszéltem, amikor azt mondtam, hogy a flops önmagában nem sokat ér."
    -- Nem, te nem csak azt mondtad, hanem azt, hogy alig valamire lehet azt használni. Pedig lehetni lehet sokmindenre.

    "Most hirtelen nehéz lett programozni a GPU-kat? Eddig pont az ellenkezőjéről akartál meggyőzni."
    -- Ez nem így van, kevesed a dolgokat. Nem arról beszéltem, hogy milyen nehéz vagy könnyű, hanem hogy sokmindenre használható. Az egy másik kérdés, mennyire nehezen és hatékonyan. Ugye érted a különbséget?

    "De azzal már nincs szívás, így simán használhatják."
    -- Csak úgy, mint PS3-on. De itt nem fognak itt megállni, mert egy GPU nem-grafikai felhasználásánál még mindig sokkal könnyebben használható a Cell, és ott áll a kihasználandó erő mindenki gépében.

    "A kettő általában üti egymást."
    -- Azok nem is fognak pénzt keresni a PS3-mal... Mások meg fognak.
  • dez
    #414
    "De ne erről beszélj, mert nem ezzel vitatkozom."
    -- De kicsit félreértettél, mert én sem csak a játék belső történetére gondoltam, hanem bizonyos mértékig a megvalósításra is.

    "Vannak átmenetek is. Ma már elvárják, elég komoly elvárások vannak ezen a téren az átlag játékkal szemben is. Nézz meg egy idén kiadott RTS-t."
    -- Oké, nyilván, de ez még ma is inkább a feelinghez tesz hozzá, a szép grafikával együtt. Annyira nem realisztikus, hogy bármit megtehess, épp ellenkezőleg.

    "Ezt jól megaszondtad."
    -- Szerintem teljesen érthető.
  • dez
    #413
    "Amikor full random adat elérésre van szükség."
    -- De ezt már tovább osztottuk két felé: amikor össze kell szedni az adatokat (össze-vissza mindenhonnan), és utána feldolgozni, ill. amikor összeszedés közben dől el a köv. hozzáférés helye. De ha az utóbbi esetre gondoltál konkrétan, akkor is rossz helyen tetted, mert itt az elsőről volt szó.

    "Nem erről beszélek. Miért olyan nehéz megérteni? A nagyobb poligonszám csak azért érdekes, mert lehetővé tesz egy csomó új fícsört.
    Néha komolyan azt hiszem, hogy szándékosan érted félre amit írok."
    -- Dehogy nehéz megérteni. Csak arról van szó, hogy egy bizonyos szám fölött /játékelem ez önmagában nem tesz hozzá már a játékmenethez. Csak mégrészletesebbek lesznek.

    "Nem erről van szó. A cell alapötlete jó, csak az ár és a hőtermelés leszorítása érdekében túl sok kompromisszumot kötöttek szerintem."
    -- Rosszul gondolod, vélhetően a korábban leírt tévedéseidre alapozva, amiket külön fogok később elemezni.

    "Egy 2-4 magos x86 plusz egy GPU-szerű segédprocival kiegésszítve sokkal hatékonyabb lehetne."
    -- Egyszer talán, de pár évig még nem: a GF6800-as programozható shadereivel elérhető számítási teljesítmény 63 GFLOPS. Hol van ez a Cell 200 feletti GFLOPS-ához képest? Ráadásul egy GPU sokkal kötöttebb, és nehézkesebben használható, mint a Cell. Tehát feljesztési időben is problémás.

    "Persze ma még sokkal drágább is lenne."
    -- A Cell sem olcsó holmi.

    "Megemlíteni lehet, csak félrevezető, ha az átlaggal hasonlítod a kivételt."
    -- Ne hülyéskedj már, miért ne lehetne azt mondani, hogy néhány régi játék játékmenet szempontból volt olyan komplex, mint egy mai átlagos ilyen-olyan típusú játék?

    "Nemtom, engem nem zavar."
    -- Lassú a szemed. :)

    "Egyébként a render FPS és a gamelogic FPS független egymástól. Nálunk a gamelogic fixen 10 FPS-sel megy."
    -- Az fps-t, mint mértékegység kisbetűvel szokás írni. Mégpedig azért, hogy meg lehessen különböztetni a nagybetűs FPS-től, ami a First Person Shooter rövidítése. Remélem nem FPS-t csináltok, mert ahhoz kevés lenne a gamelogicnak is a 10fps.

    "Ez csak akkor igaz, ha lehet őket párhuzamosan végrehajtani."
    -- Nyilván, de sokmindent lehet.

    "Pont arról van szó, hogy időbe telik átírni mindent."
    -- PS3-ra sok egyedi fejlesztés lesz, ami szinte a 0-ról írnak meg. De ha x360-on is lesz valami, az sem baj, oda is párhuzamosítani kell sokmindent.

    "konzolon a GPU driver egész másképp néz ki szerintem. A többi meg minimális CPU-t igényel."
    -- PS3-on OpenGL alapú lesz, így a driver sem lehet nagyon más, mint a szokásos. De akárhogy is lesz, a poligonokkal lesz meló.
  • dez
    #412
    "Nem ez a lényeg. Arról van szó, hogy X2-n ugyanúgy futnak az egyszálú játékok, mint az egymagosakon. Tehát a fejlesztőknek nem kell sietniük annyira a fejlesztéssel. Konzolon többszálúsítás nélkül nincs életképes játék."
    -- Rendben, de te nem azt írtad, hogy nem olyan nagy gond, ha egy egyszálú játékot futtatunk egy dual-core procin, hanem egyenesen azt, hogy nem lesz lassabb, ami így nem mindig igaz.

    "Kevesen engedhetik meg maguknak, hogy leáljanak a játék fejlesztéssel fél-egy évre, hogy egy teljesen új motort fejlesszenek (akik megpróbálták, többnyire belebuktak). A megoldás a folyamatos fejlesztés (refaktoring), ami viszont tovább tart."
    -- Azok engedhetik meg maguknak, akiknek a főnökeik komoly PS3-as projektekben göondolkodnak, és tisztában vannak ennek velejáróival.
  • BiroAndras
    #411
    "Ezért kompromisszumokat kell kötni."

    A kompromisszum az, hogy nem használják ki az új cucc minden képességét elsőre.

    "Nem. A Cell olyan, amilyen. A srácnak meg vagy lesz kedve igazán kihasználni, vagy nem. Ennyi."

    Tényleg nem érted, vagy csak nem akarod érteni? Azért nem tetszik neki, mert a gyakorlatban messze nem olyan erős, mint amilyennek reklámozták, és ráadásul nehéz programozni.

    "Az ilyen felesleges hatásvadász szövegeket inkább hagyjuk, ha lehet..."

    Ezt most komolyan nem értem. Kifogytál az értelmes válaszokból?

    "Lásd amit a kompromisszumokról írtam. Ja, és szerintem az IBM és a Sony mérnökei sem teljesen hülyék..."

    Nem hülyék, csak olcsó konzol chip-et kellet építeniük.
    És nincs vele akkora gond, csak éppen az messze nem igaz, hogy 20-30-szoros teljesítménye lenne egy PC-hez képest. Viszont meg kell tanulni programiozni, ami időbe telik. Ezek miatt a PS3-as játékok nem fogják úgy megelőzn a PC-seket, mint ahogy azt sokan várják. Mire elkezdik rendesen kihasználni a cell-t, addigra elterjednek a 4 magos x86 procik, amik már bőven versenyképesek lesznek (pláne fizikai gyorsítóval támogatva).

    "Ha valaki nem akar mindent "lustán" a PPE-re bízni, akkor nem lesz gond."

    Nem lustaság, hanem idő és pénz.

    "Nem csak magát a hw-t kiismerni tartott ennyi ideig, hanem lassan erősödött fel az igény és a hajlandóság az ilyen szokásostól eltérő rendszerek kihasználására."

    Pontosan.

    "A PS3 esetén nem kell az egészet az elejétől eljátszani."

    A fejlesztők reakcióit látva én ebben nem hiszek.

    "Valakinek a munkája egyben a hobbija..."

    Nem érted. Úgy csinálsz, mintha még sose dolgoztál volna határidőre.
    Nekem is ugyanaz a munkám és a hobbim, mégis egész másképp állok hozzá. Kísérletezni otthon szeretek, veszélytelenül, határidők nélkül. A munkát gyorsan és biztonságosan kell elvégezni. Ráadásul nem én választom meg, hogy mit és mikorra kell csinálni.

    ""ismerős hardver legyen a keze alatt (és minél több teljesítmény persze)."
    Ilyen ma nem létezik (elérhető áron), a Cell szintjén."

    Mintha valami kompromisszumokról beszéltél volna az előbb. Itt pontosan erről van szó. Ha én játékot akarok fejleszteni, nem feltétlen a nyers teljesítmény a legfontosabb szempont.

    ""A kettő akkor békíthető össze, ha az új platform valami olyat tud, amire jó játékot lehet írni. A cell ilyet igazából nem kínál szerintem."
    -- Nagyon kevés a fantáziád..."

    Mondj valami olyat, amit nem lehet megcsinálni egy X2-vel és egy extra GPU-val.

    "Az utóbbiak jóval kisebb teljesítményt nyújtanak -> egyszerűbb fizika."

    Egy jobb GPU flops-ban veri a cell-t. Másrészt egész jó fizikát lehet csinálni már egy átlagos egymagos CPU telejsítményének kis részével is. Szeritnem egy GPU teljesítménye bőven elég egyelőre. Még azzal se tudnánk mit kezdeni jelenleg.

    "És egy GPU, bár már sokmindenre használható (mint már beszéltünk róla), de mindenképp jóval kötöttebb, még jóval nehezebb kihaszálni ilyesmire."

    Látod, erről beszéltem, amikor azt mondtam, hogy a flops önmagában nem sokat ér.

    "Tehát a Cellnél még jóval több "szívás" van vele, így kevesen fognak nekiállni."

    Most hirtelen nehéz lett programozni a GPU-kat? Eddig pont az ellenkezőjéről akartál meggyőzni.

    "Inkább csak a kész fizikai csomagot fogják használni."

    De azzal már nincs szívás, így simán használhatják.

    "Beszéljünk inkább azokról, akiket a kihívás is érdekel, és a profit is..."

    A kettő általában üti egymást.
  • BiroAndras
    #410
    "Én viszont a lényegi játékmenet összetettségéről beszéltem, és hogy ahhoz önmagában nem kell olyan sok kakaó."

    De ne erről beszélj, mert nem ezzel vitatkozom.

    "Egy város kvázi-élethű szimulációja már minden szempontból nagyon komplex dolog. De a legtöbb játékban nincs erre szükség."

    Vannak átmenetek is. Ma már elvárják, elég komoly elvárások vannak ezen a téren az átlag játékkal szemben is. Nézz meg egy idén kiadott RTS-t.

    "Nem egészen. Egyrészt nem ugyanolyan, de nem is annyival egyszerűbbet (adott kivételes esetben, a legtöbb játék persze viszonylag egyszerű volt, bár néha elég cseles technikai megoldásokkal ekkor is, éppen a kis teljesítmény miatt), másrészt nem minden szempontból."

    Ezt jól megaszondtad.
  • BiroAndras
    #409
    ""De én pontosan erről az esetről beszélek."
    -- Melyikről is?"

    Amikor full random adat elérésre van szükség.

    "A poligonszámot én nem sorolnám a komplexitásba."

    Nem erről beszélek. Miért olyan nehéz megérteni? A nagyobb poligonszám csak azért érdekes, mert lehetővé tesz egy csomó új fícsört.
    Néha komolyan azt hiszem, hogy szándékosan érted félre amit írok.

    "Természetesen nem mindenre, de azért nem olyan kevés az, ha okosan használják. Nyilván jobb lenne 1GB közös ram 50GB/s-sel, "0" késleltetéssel, de az ma még elérhetetlen."

    Nem erről van szó. A cell alapötlete jó, csak az ár és a hőtermelés leszorítása érdekében túl sok kompromisszumot kötöttek szerintem. Volt már ilyenre sok példa. Egy 2-4 magos x86 plusz egy GPU-szerű segédprocival kiegésszítve sokkal hatékonyabb lehetne. Persze ma még sokkal drágább is lenne.

    "No és miért ne lehetne megemlíteni pár régi kivételt a mai átlaghoz képest?"

    Megemlíteni lehet, csak félrevezető, ha az átlaggal hasonlítod a kivételt.

    "Engem bárhol zavar a 20-30fps. Az egyszerűen nem folyamatos, hanem darabos, így nem természetes, rossz a szemnek."

    Nemtom, engem nem zavar. Egyébként a render FPS és a gamelogic FPS független egymástól. Nálunk a gamelogic fixen 10 FPS-sel megy.

    "Nos, ha több feladatod van, amiket így is-úgy is végre kell hajtanod, akkor mindegy, hogy gyorsan és egymás után, vagy egyenként kicsit lassabban, de párhuzamosan hajtódnak végre."

    Ez csak akkor igaz, ha lehet őket párhuzamosan végrehajtani.

    "Miért ne lenne több szál? Oké, a motorok ma még egyszálasak (de mint szó volt róla ezen ideje változtani, pc-n is)"

    Pont arról van szó, hogy időbe telik átírni mindent.

    "de van ott még más feladat is bőven (GPU driver, hangeffektek, stb.)."

    konzolon a GPU driver egész másképp néz ki szerintem. A többi meg minimális CPU-t igényel.
  • BiroAndras
    #408
    "Na de hát most írom, hogy az olcsóbb X2-k magonkénti órajele kevesebb, mint egy nálánál olcsóbb csúcs-egymagosé!"

    Nem ez a lényeg. Arról van szó, hogy X2-n ugyanúgy futnak az egyszálú játékok, mint az egymagosakon. Tehát a fejlesztőknek nem kell sietniük annyira a fejlesztéssel. Konzolon többszálúsítás nélkül nincs életképes játék.

    "Egy igazán jó programozó hamar megtanulja ezeket."

    Nem csak igazán jók vannak. A többség csak jó, vagy közepes. És nem csak megtanulni kell, hanem a meglevő kódot átírni, és párhuzamosan játékot is fejleszteni. Kevesen engedhetik meg maguknak, hogy leáljanak a játék fejlesztéssel fél-egy évre, hogy egy teljesen új motort fejlesszenek (akik megpróbálták, többnyire belebuktak). A megoldás a folyamatos fejlesztés (refaktoring), ami viszont tovább tart.

    "De itt az XP-ről volt szó. Arra írtad, hogy a 64 bitesre is van elég driver, pedig nincs."

    Nem arra írtam. Vagy legalábbis nem azt akartam.
  • dez
    #407
    (Az első oldal nemrég volt belinkelve, de mindegy.)
  • dez
    #406
    A cikk címében is szerepelt a 6GHz, és a cikkben az szerepelt, hogy a jelenlegi 4-5GHz feljebb is tornászható.
    Hamarosan a Cellt is 65nm-en gyártják majd.
    A Power6 egy szerver-chip, természetes, hogy sokkal nagyobb. (Vélhetően nem kevés L2-L3 is van benne, stb.)
  • dez
    #405
    "Nos, ha hobbiról van szó, akkor a különlegesség jó, ha viszont határidőre elvégzendő munkáról, akkor az embre sokkal jobban szereti a jól ismert dolgokat."
    -- Nyilván, csak épp ma még mincsenek (ésszerű áron) 10GHz-es, vagy sokmagos procik. Ezért kompromisszumokat kell kötni.

    "Hát érdekesen nézne ki egy mai 3D motor shader-ek nélkül."
    -- Azokat általában utólag is beépítheti egy másik programozó, az adott projekt grafikusaival együttműködve, igénytől függően...

    "Az optimalizáláshoz mindíg alaposan ismerni kell a hardvert."
    -- Oké, ez igaz, de azért a DX sokat segít ebben a kérdésben. (Hogy milyen hatékonyan, az már más kérdés.)

    "Tehát még mindíg azt mondod, hogy a cell az tökéletes, tehát ha neki nem jött be, akkor ő a hülye."
    -- Nem. A Cell olyan, amilyen. A srácnak meg vagy lesz kedve igazán kihasználni, vagy nem. Ennyi.

    "Az nem jutott eszedbe, hogy ő már látta, sőt programoztta a cell-t, te meg nem? Nem lehet, hogy esetleg ő jobban tudja?"
    -- Az ilyen felesleges hatásvadász szövegeket inkább hagyjuk, ha lehet...

    "Nem csak a "szívás" a lényeg, hanem az objektív korlátok."
    -- Lásd amit a kompromisszumokról írtam. Ja, és szerintem az IBM és a Sony mérnökei sem teljesen hülyék... Ha valaki nem akar mindent "lustán" a PPE-re bízni, akkor nem lesz gond.

    "A "szívás" meg azt jelenti, hogy csak soká (évek múlva) fogják tudni jól kihasználni."
    -- Bizonyára sokan, de nem feltétlenül vonatkozik ez mindenkire.

    "A PS2-t is sokan szídták. De aztán belejöttek."

    "Mennyi idő alatt? Még a legutolsó játékok is jobban kihasználták, mint az eggyel korábbi generáció. Tehát évekig tartott kiismerni. A cell meg még egzotikusabb cuccos."
    -- Nem csak magát a hw-t kiismerni tartott ennyi ideig, hanem lassan erősödött fel az igény és a hajlandóság az ilyen szokásostól eltérő rendszerek kihasználására. A PS3 esetén nem kell az egészet az elejétől eljátszani. És most a segítség is sokkal több.

    "Megint csak arról van szó, hogy hobbi, vagy munka."
    -- Valakinek a munkája egyben a hobbija...

    "ismerős hardver legyen a keze alatt (és minél több teljesítmény persze)."
    -- Ilyen ma nem létezik (elérhető áron), a Cell szintjén.

    "A kettő akkor békíthető össze, ha az új platform valami olyat tud, amire jó játékot lehet írni. A cell ilyet igazából nem kínál szerintem."
    -- Nagyon kevés a fantáziád...

    "A teljesítménye leginkább fizikára használható ki jelenleg, amit viszont már PC-n is meg lehet valósítani. Jön már a dualcore CPU, a GPU-s fizika, és a Physix chip is."
    -- Az utóbbiak jóval kisebb teljesítményt nyújtanak -> egyszerűbb fizika. (Főleg a Physix esetén, amit egy X1600 is keresztben lenyel állítólag.)

    "Egy modern GPU is tud annyi gflop-ot, mint a cell (persze a gflop önmagában kevés)."
    -- Nem hiszem. És egy GPU, bár már sokmindenre használható (mint már beszéltünk róla), de mindenképp jóval kötöttebb, még jóval nehezebb kihaszálni ilyesmire. Tehát a Cellnél még jóval több "szívás" van vele, így kevesen fognak nekiállni. Inkább csak a kész fizikai csomagot fogják használni.

    "Igaz, a cell olcsóbb, de a fejlesztő szempontjából ez nem olyan fontos, főleg ha csak a kihívás érdekli, nem a profit."
    -- Beszéljünk inkább azokról, akiket a kihívás is érdekel, és a profit is...
  • dez
    #404
    "Ezek közül a Mercenary-t ismerem. A játékmenete valóban nagyon komplex volt, de nem erről beszéltem. Sajnos manapság nem a játékmenetre gyúrnak, hanem grafikára."
    -- Én viszont a lényegi játékmenet összetettségéről beszéltem, és hogy ahhoz önmagában nem kell olyan sok kakaó. Nem hogy egy PPE, egy 6502-es is sokmindenre elég volt. Most az, hogy a játékban részt vevő elemek hány poligonból állnak, és más efféle egy másik része a dolognak. És itt jött az, hogy utóbbiak kezelésébe az SPE-k is nagyban besegítenek.

    "A komplexitás a megvalósítás részleteiben van. A világot realisztikussá és élővé tenni iszonyat sok munka."
    -- Nyilván. Egy város kvázi-élethű szimulációja már minden szempontból nagyon komplex dolog. De a legtöbb játékban nincs erre szükség.

    "De hogy tisztázzuk : arról akarsz meggyőzni, hogy régen kevesebb ember, kevesebb idő alatt, nagyságrenddekkel gyengébb gépekre ugyanolyan komplex játékokat készített?"
    -- Nem egészen. Egyrészt nem ugyanolyan, de nem is annyival egyszerűbbet (adott kivételes esetben, a legtöbb játék persze viszonylag egyszerű volt, bár néha elég cseles technikai megoldásokkal ekkor is, éppen a kis teljesítmény miatt), másrészt nem minden szempontból.
  • dez
    #403
    "De én pontosan erről az esetről beszélek."
    -- Melyikről is?

    "Pontosan erről beszélek. Régen nem volt, ma van -> nagyobb komplexitás."
    -- A poligonszámot én nem sorolnám a komplexitásba. Esetleg ha minden poligonnak jelentősége van a játékban, a játékmenet szempontjából, de ilyen nem nagyon van.

    "Te említetted a Z80-at."
    -- ZX80/81-et. Ezek gépek voltak, valami pár k-s rammal.

    "Erre mondtam, hogy akkoriban sokkal kevesebb adattal dolgoztak, így nem meglepő, hogy elboldogult kevés memóriával is.
    Érdekes, hogy mennyit idézik BG mondását, miszerint 640K legyen elég mindenkinek. Ehhez képest most arról akarsz meggyőzni, hogy 256K elég mindenre."
    -- Természetesen nem mindenre, de azért nem olyan kevés az, ha okosan használják. Nyilván jobb lenne 1GB közös ram 50GB/s-sel, "0" késleltetéssel, de az ma még elérhetetlen.

    "Értelmes összehasonlítást csak akkor kapsz, ha az átlagot az átlaggal hasonlítod, vagy a kivételt a kivétellel."
    -- No és miért ne lehetne megemlíteni pár régi kivételt a mai átlaghoz képest?

    "Ez rád is vonatkozik."
    -- Én igyekszem figyelni.

    "FPS-nél vagy szimulátornál lehet kevés. Bár engem nem zavar annyira.
    Viszont RTS-nél bőven elég ennyi."
    -- Engem bárhol zavar a 20-30fps. Az egyszerűen nem folyamatos, hanem darabos, így nem természetes, rossz a szemnek.

    "Ezt mondom én is. Adott a SIMD környezet és adott a nem SIMD feladat. Az eredmény kihasználatlan gflops-ok tömege."
    -- Ha mindenáron egy SPE-vel akarjuk csinálni. (Bár ha más dolga úgysincs, akkor mindegy.) És nem egy PPE szál.

    "Nos ezzel csupán átlagosan tudod csökkenteni a késleltetés hatását. Az adott feladat, ami vár a memóriára nem lesz gyorsabb."
    -- Ilyen nyilvánvalóságokat minek írsz le, amikor éppen ebből indultunk ki? Nos, ha több feladatod van, amiket így is-úgy is végre kell hajtanod, akkor mindegy, hogy gyorsan és egymás után, vagy egyenként kicsit lassabban, de párhuzamosan hajtódnak végre.

    "Egyébként pont az in-order működés miatt nincs meg az a párhuzamosítás ami máshol ezt megoldaná. Más szálak végrehajtása szintén segít, de csak ha vannak."
    -- Ezzel meg mit akarsz mondani? Itt alapvetően több szálról van szó. Miért ne lenne több szál? Oké, a motorok ma még egyszálasak (de mint szó volt róla ezen ideje változtani, pc-n is), de van ott még más feladat is bőven (GPU driver, hangeffektek, stb.).
  • dez
    #402
    "Nem ez a lényeg, hanem hogy aki X2-t vesz, annak nem fognak gyengébben futni az 1 szálú játékok. Tehát a 2 mag kihasználása nem égető kényszer, hanem egy lehetőség."
    -- Na de hát most írom, hogy az olcsóbb X2-k magonkénti órajele kevesebb, mint egy nálánál olcsóbb csúcs-egymagosé! (Ha a túlhúzást is beszámítjuk, akkor is igaz, mert egy dual-core általában nem húzható annyira, mint az egymagos társa.)

    "Az is csinálja persze, de nem varázsló. Csak abból tud dolgozni, amit a programozó odaad neki. Ha a cache-gyilkos kódot írsz, azzal nem tud mit kezdeni. Nem tudja helyetted eldönteni, hogy a float-tal double-lal, vagy int-tel lesz gyorsabb az algoritmusod. Meg még csomó ilyen apróság van, ami nagyon tudja befolyásolni a futás sebességét. De még a magasabb szintű algoritmusok és adatszerkezetek is számíthatnak."
    -- Épp ezért írtam, hogy ilyen dologra azért oda kell figyelni.

    "PC-n is célszerű lineárisan olvasni a memóriát, de a konzolokon ez sokkal fontosabb. Emiatt pl. a lineáris keresés néha gyorsabb lehet a binárisnál.
    A konzol CPU-k speciális felépítése miatt sokkal több ilyen dologra kell figyelni, és sokkal többet számítanak. Ezek megtanulása időbe telik. És akkor még nem is beszéltünk az SPE-kről, amiket alapvetően másképp kell programozni."
    -- Egy igazán jó programozó hamar megtanulja ezeket.

    "Persze, hiszen még ki se jött a Vista. De már fél éve volt (béta) driver rengeteg hardverhez."
    -- De itt az XP-ről volt szó. Arra írtad, hogy a 64 bitesre is van elég driver, pedig nincs.

    "Nyílván ami a rendszerbe belepiszkál (pl Daemon Tools). De ezek nem a 32-64 bittől függenek. És nyílván lesz majd áj verziójuk.
    Sajnos nem volt időm komolyabban tesztelni a kompatibilitást, de az a pár progi, amit elindítottam gond nélkül ment. Az MS eddig nagyon komolyan vette a kompatibilitást, úgyhogy nem aggódom."
    -- Én jópár programról hallottam, ami nem ment rendesen. Úgyhogy pár dolog mégiscsak megváltozhatott. És a hírek szerint a 32 és 64 bites Vista között is lesz pár alapvető különbség.
  • BiroAndras
    #401
    Még cell-es cikkek:
    http://en.wikipedia.org/wiki/Cell_(microprocessor)
    http://www.anandtech.com/showdoc.aspx?i=2379&p=3
  • BiroAndras
    #400
    "Ja, és van itt ilyen is: Power6@6GHz"

    Jól néz ki.
    De csak 4-5GHz, és még nincs is a piacon. Ez a technológia már biztosan nem lesz a cell-ben. És a magas órjelet csak 65nm-en tudták elérni, a cell meg még 90nm-en készül. És 750 millió tranzisztor van benne, míg a teljes cell csak 230 millió, és ennek is csak kis része a PPE.
  • BiroAndras
    #399
    "PC-kocka != hülye. Itt inkább programozási stílusról, izlésről van szó. Van, aki kedveli a különlegességet."

    Nos, ha hobbiról van szó, akkor a különlegesség jó, ha viszont határidőre elvégzendő munkáról, akkor az embre sokkal jobban szereti a jól ismert dolgokat.

    "Talán ha shaderprogramokat is írt."

    Hát érdekesen nézne ki egy mai 3D motor shader-ek nélkül.

    "Ettől eltekintve nem kellett túl sokat foglalkoznia a GPU-val"

    Az optimalizáláshoz mindíg alaposan ismerni kell a hardvert.

    "Remélhetőleg a munkája minőségében nem mutatkozik meg a hozzáállása. De szerintem ilyen hozzáállással nem fogja tökéletesen kihasználni a HW-t."

    Tehát még mindíg azt mondod, hogy a cell az tökéletes, tehát ha neki nem jött be, akkor ő a hülye. Az nem jutott eszedbe, hogy ő már látta, sőt programoztta a cell-t, te meg nem? Nem lehet, hogy esetleg ő jobban tudja?

    "Nem úgy általában nem csinál jó kódot, csak talán nem lesz kedve túl sokat "szívni" a Cellel."

    Nem csak a "szívás" a lényeg, hanem az objektív korlátok.
    A "szívás" meg azt jelenti, hogy csak soká (évek múlva) fogják tudni jól kihasználni.

    "A PS2-t is sokan szídták. De aztán belejöttek."

    Mennyi idő alatt? Még a legutolsó játékok is jobban kihasználták, mint az eggyel korábbi generáció. Tehát évekig tartott kiismerni. A cell meg még egzotikusabb cuccos.

    "Van, aki szereti a kihívásokat (amiknek viszont meg van az eredménye), és van, aki nem."

    Megint csak arról van szó, hogy hobbi, vagy munka.
    Az ember otthon elszöszöl mindenfélével, és nem érdekes, hogy meddig tart, vagy sikerül-e egyáltalán. Viszont ha munkáról van szó, akkor nem te döntöd el, hogy mit csinálsz, és még határidő is van (általában szűk).
    A másik meg hogy lehet cél a PS3 programozása, és akkor annál izgalmasabb, minél egzotikusabb a hardver, és lehet cél a játékfejlesztés, amikor meg azt szeretné az ember, hogy egyszerűen programozható, ismerős hardver legyen a keze alatt (és minél több teljesítmény persze). A kettő akkor békíthető össze, ha az új platform valami olyat tud, amire jó játékot lehet írni. A cell ilyet igazából nem kínál szerintem. A teljesítménye leginkább fizikára használható ki jelenleg, amit viszont már PC-n is meg lehet valósítani. Jön már a dualcore CPU, a GPU-s fizika, és a Physix chip is. Egy modern GPU is tud annyi gflop-ot, mint a cell (persze a gflop önmagában kevés).
    Igaz, a cell olcsóbb, de a fejlesztő szempontjából ez nem olyan fontos, főleg ha csak a kihívás érdekli, nem a profit.
  • BiroAndras
    #398
    "Már csak néhány névre emlékszem. C64: Mercenary, Elite, stb., Amiga: Virus, stb."

    Ezek közül a Mercenary-t ismerem. A játékmenete valóban nagyon komplex volt, de nem erről beszéltem. Sajnos manapság nem a játékmenetre gyúrnak, hanem grafikára.
    A komplexitás a megvalósítás részleteiben van. A világot realisztikussá és élővé tenni iszonyat sok munka.

    De hogy tisztázzuk : arról akarsz meggyőzni, hogy régen kevesebb ember, kevesebb idő alatt, nagyságrenddekkel gyengébb gépekre ugyanolyan komplex játékokat készített?
  • BiroAndras
    #397
    Elvben válaszoltam erre is, de úgy tűnik nem ment el.

    "Nos ez a korábban taglalt 3. eset lenne, de itt az 1. esetről beszéltünk."

    De én pontosan erről az esetről beszélek.

    "Ez már "újgenerációs" dolog, hiszen régen eleve nem lehetett annyi poligon, amennyi ehhez kell."

    Pontosan erről beszélek. Régen nem volt, ma van -> nagyobb komplexitás.

    "Kissé keverednek itt a dolgok, itt nem a régi játékokról volt szó, hanem a SPE-kről."

    Te említetted a Z80-at. Erre mondtam, hogy akkoriban sokkal kevesebb adattal dolgoztak, így nem meglepő, hogy elboldogult kevés memóriával is.
    Érdekes, hogy mennyit idézik BG mondását, miszerint 640K legyen elég mindenkinek. Ehhez képest most arról akarsz meggyőzni, hogy 256K elég mindenre.

    "Ejj, te nem, én viszont igen, lévén arról beszéltem, hogy voltak kivételek."

    Értelmes összehasonlítást csak akkor kapsz, ha az átlagot az átlaggal hasonlítod, vagy a kivételt a kivétellel.

    "Tudod, néha a másik ember is mond valamit, és ha értelmesen akarsz beszélgetni, akkor oda kell figyelni, mit is mond."

    Ez rád is vonatkozik.

    "20-30fps kevés. Elég tré lenne egy olyan játék, ami sosem megy többet ennyinél."

    FPS-nél vagy szimulátornál lehet kevés. Bár engem nem zavar annyira.
    Viszont RTS-nél bőven elég ennyi.

    De mindegy, pár százmillió művelet is túl nagy terhelés lenne egy fejlett x86-nak is, mivel más dolga is van.

    "Nem túl optimális egy-egy adattal dolgozni SIMD környezetben, ebben nincs semmi meglepő."

    Ezt mondom én is. Adott a SIMD környezet és adott a nem SIMD feladat. Az eredmény kihasználatlan gflops-ok tömege.

    "Dehogynem. Már írtam: párhuzamosan több feladat végzése. Ilyenkor nem holt idő a késleltetés miatti várakozás."

    Nos ezzel csupán átlagosan tudod csökkenteni a késleltetés hatását. Az adott feladat, ami vár a memóriára nem lesz gyorsabb.
    Egyébként pont az in-order működés miatt nincs meg az a párhuzamosítás ami máshol ezt megoldaná. Más szálak végrehajtása szintén segít, de csak ha vannak.
  • BiroAndras
    #396
    "Ez akkor igaz, ha nem számít az ár"

    Nem ez a lényeg, hanem hogy aki X2-t vesz, annak nem fognak gyengébben futni az 1 szálú játékok. Tehát a 2 mag kihasználása nem égető kényszer, hanem egy lehetőség.

    "A komplikáltabb optimizációt eddig is a compiler csinálta."

    Az is csinálja persze, de nem varázsló. Csak abból tud dolgozni, amit a programozó odaad neki. Ha a cache-gyilkos kódot írsz, azzal nem tud mit kezdeni. Nem tudja helyetted eldönteni, hogy a float-tal double-lal, vagy int-tel lesz gyorsabb az algoritmusod. Meg még csomó ilyen apróság van, ami nagyon tudja befolyásolni a futás sebességét.
    De még a magasabb szintű algoritmusok és adatszerkezetek is számíthatnak. PC-n is célszerű lineárisan olvasni a memóriát, de a konzolokon ez sokkal fontosabb. Emiatt pl. a lineáris keresés néha gyorsabb lehet a binárisnál.
    A konzol CPU-k speciális felépítése miatt sokkal több ilyen dologra kell figyelni, és sokkal többet számítanak. Ezek megtanulása időbe telik. És akkor még nem is beszéltünk az SPE-kről, amiket alapvetően másképp kell programozni.

    Talán ezt az in-order dolgot is el tudja intézni, amiennyire lehet. Esetleg valamennyire oda kell figyelni. Ezeken kívül kb. ugyanazok az elvek érvényesek, mint eddig: minnél több regiszter használata, stb.

    "Hát, én nem egészen ezt hallottam eddig: nem mindenhez van driver"

    Persze, hiszen még ki se jött a Vista. De már fél éve volt (béta) driver rengeteg hardverhez.

    "és pár dolog nem fut rendesen."

    Nyílván ami a rendszerbe belepiszkál (pl Daemon Tools). De ezek nem a 32-64 bittől függenek. És nyílván lesz majd áj verziójuk.
    Sajnos nem volt időm komolyabban tesztelni a kompatibilitást, de az a pár progi, amit elindítottam gond nélkül ment. Az MS eddig nagyon komolyan vette a kompatibilitást, úgyhogy nem aggódom.
  • dez
    #395
    Ja, és van itt ilyen is: Power6@6GHz
  • dez
    #394
    #384-re nem válaszoltál, de mindegy.