• kvp
    #61
    "2. Több oldalas program? LOL. 4 egymásba ágyazott for ciklus, néhány dma-s olvasás-hívás, és pár egyéb egyszerű művelet. Ennyi."

    Es mindez egy sima egysoros for ciklus kedveert? Mit csinalnal egy 8-szorosan egymasbaagyazott for ciklussal??? 32 for ciklust? Csak azert kerdezem, mert sajnos van olyan problema aminel szukseg van a 8 ciklusra, es ha nincs eleg kozvetlen eleresu ram (vagy eppen nem eleg nagy a cache) akkor nagyon lassuva valik a dolog. Lehet particionalni a problemat, de az viszont sokkal bonyolultabb programot eredmenyez. Szenvedtem vele eleget, legyeny annyi eleg, hogy mintaillesztesrol van szo nagy adatmennyisegre, amiben pont a cell-nek kellene jonak lennie. Nem az, meg az ibm fele cell blade-ben sem, pedig csak fixpontos szamitasok vannak. (ps3-ast meg nem programoztam, cell-t mar igen, ha tobb ram lenne a ps3-ban akkor jobban megerne mint az ibm blade-ek, igy inkabb csak otthoni pc kategoria)

    "3. Ha ez neked egy nagynehezen megoldható és leprogramozható feladat, akkor talán nem programozással kellene foglalkoznod. Legalábbis nem játékprogramozás (de nem is ezt csinálod szerencsére), ahol ennél sokkal bonyolultabb dolgok is vannak."

    Jatekokat csak hobbibol fejlesztek, azt is ritkan. Sokkal komolyabb a munkam, de van koze a jatekfejlesztesnel is szukseges algoritmusokhoz, csak ez elesben megy.

    "(4. A leírt eljárást lehetne még alaposan gyorsítani azzal, ha a DMA műveletek másik bufferekbe töltenének, mint amikben a párok keresése zajlik - egymást nem zavarva, sávszélességet nem elvéve! És ez is csak minimálisan bonyolítaná meg. Nem beszélve a következőkről.)
    5. Olyan feladatot húzol elő, ami egyátalán nem az SPE-knek való, és úgy állítod be, mintha ez lenne az általános eset."

    Vegul egy ennel csak egy kicsit bonyolutabb problemat sikerult egy altalanos vektorprocesszorral megoldatni, csak a memoria merete kellett hogy nagyobb legyen. Es mivel pont befert az L2 cache-be a tejes dataset (10 Mb) ezert sikerult majdnem olyan gyors memoriahozzaferest produkalni mint a cell spu-janak a belso ramjaban. (azaz 1 orajeleset) A ps3 rendszer ram-ja eleg gyors lehetne igy is, csak nem erre terveztek a processzort.

    "6. Konzekvensen "megfeledkezel" a következőkről - annak ellenére, hogy direkt figyelmeztettelek rájuk:
    - A Cellben van egy átalános, a memóriát szokásosan elérő proci-mag is, a PPE, amivel ugyanúgy egy sor (C-ben) ez a dolog!
    - A PPE hozzáfér az SPE-k ramjához, pl. beírhatja nekik a main memóriából össze-vissza összeszedett értékeket, stb. Tehát a feladatokat szét lehet osztani a PPE és az SPE-k között úgy, hogy mindkettő a számára legjobban fekvőt csinálja.
    - Az SPE-k hozzáférnek egymás memóriájához is, azaz ha szükséges, nem 256KB-tal kell gazdálkodni, hanem lehet akár 2MB-tal is! Ez már nem olyan kevés.
    - Ha éppenséggel nem csak összeadni kell számokat, hanem bonyolultabb, lassabb műveletet végezni, máris fordul a kocka, és kijön a több mag és a gyors belső memória előnye."

    A PPE feladata az uzleti logika (jatekszabalyok) futtatasa kellene hogy legyen, nem az SPE-k etetese tipikus vektorfeladatok adataival vagy ezek kiszamitasa. De mivel a legtobb programozo csak a PPE-re tud kapasbol jo kodot irni, ezert jobban jarunk ha egy gep kap 3 PPE-t, mintha kap 8 SPE-t. Nem a teljesitmeny miatt, hanem mert igy jobb a programozonak es jobb a programozo cegenek is. A teljesitmeny uzleti szempontbol nem fontos, boven eleg ha optimalizalas nelkul gyorsan kesz a program es a vasarlo megveszi a termeket. 3 altalanos cpu-ra jobb fejleszteni, ahol a tervezesi limitek olyan magasan vannak hogy elobb fogy el minden eroforras (pl. rendszer memoria) mint hogy tullepjuk a cimzesi es egyebb tervezesi korlatokat. Legfeljebb egy picit szaggat a program, de pillanatok alatt osszerakhato. Egy rendszer nem attol jobb, hogy technikailag jobb, hanem attol hogy tobb penzt hoz. (lasd a sony esetet a betamax-al, ami tenyleg jobb, csak hat a vhs olcsobb volt)

    Kedves dez, bizonygatod hogy a cell jobb technikailag. Ez _igaz_, csak eppen nem jo _uzleti_ szempontbol, ahol az olcson-gagyit-gyorsan elv ervenyesul. A wii is pont ezert nyereseges. Nem er annyit amennyiert adjak, de megis veszik es ezzel agyonkeresi magat a nintendo, mig a sony csak veszit a minosegen.