513
-
dez #393 "Tehát, aki nem ért egyet veled (más nem tudsz róla), az mindenképpen csak hülye lehet."
PC-kocka != hülye. Itt inkább programozási stílusról, izlésről van szó. Van, aki kedveli a különlegességet.
"Egyébként, ha nem figyeltél volna, 3D-t programozott, amibe erősen beletartozik a GPU programozása is, ami meg jobban hasonlít a cell-re, mint az x86-okra."
Talán ha shaderprogramokat is írt. Ettől eltekintve nem kellett túl sokat foglalkoznia a GPU-val, hanem a DirectX API-ját kellett használnia, a mélyebb dolgokat DirectX és a GPU-driver intézi...
"Nos, az ileltő cég maga a Sony. És nem nem igazán akarják kirúgni."
Remélhetőleg a munkája minőségében nem mutatkozik meg a hozzáállása. De szerintem ilyen hozzáállással nem fogja tökéletesen kihasználni a HW-t. De az is lehet, hogy csak nektek panaszkodott, azért nem utálja ennyire.
"Hát, nálunk olyan 3D motort csinált, ami lealázta a konkurenciát."
Látom, nem értetted, amit írtam. Nem úgy általában nem csinál jó kódot, csak talán nem lesz kedve túl sokat "szívni" a Cellel.
"Ja, így már értem. Mi akadályoz meg téged, hogy a helyében legyél? Ha olyan jó vagy, akkor ez nem okozhat gondot."
Nem lehet 1 lépésben oda kerülni, és nincs kedvem újramászni a létrát. Az utóbbi években amúgy is távol sodródtam a játékprogramozástól. De kacsingatok visszafelé.
"Egyébként mint mondtam nem csak ő van rossz véleménnyel a PS3-ról és az XBox-ról, hanem az összes programozónk, akivel beszéltem. De hasonló panaszokat hallottam azoktól a fejlesztőktől is, akik már dolgoznak rajtuk."
Elhiszem, hogy panaszkodnak, nyilván egyszerűbb lenne a dolguk egy 10GHz-es egyszerű CPU-val. A PS2-t is sokan szídták. De aztán belejöttek. Van, aki szereti a kihívásokat (amiknek viszont meg van az eredménye), és van, aki nem. -
dez #392 Már csak néhány névre emlékszem. C64: Mercenary, Elite, stb., Amiga: Virus, stb. -
dez #391 "Igen, csakhogy ez nem egy egyszerű folyamat. PC-n egy mag se lassabb, mint a régebbiek, így ha ki nek is használják, legalább visszaesés nincs."
Ez akkor igaz, ha nem számít az ár: a legdrágább (leggyorsabb) egymagos is olcsóbb, mint a legolcsóbb (magonként leglassabb) kétmagos... (Ugyanabból a családból.)
"És használhatók a megszokott programozási technikák, és optimalizációk, csaupán a többszálúsításra kell figyelni."
A komplikáltabb optimizációt eddig is a compiler csinálta. Talán ezt az in-order dolgot is el tudja intézni, amiennyire lehet. Esetleg valamennyire oda kell figyelni. Ezeken kívül kb. ugyanazok az elvek érvényesek, mint eddig: minnél több regiszter használata, stb.
"A 32 és 64 bites verzió közt nincs más különbség. Tehát akinek 64 bites procija van, annak értelmetlen 32 biteset használni. Ugyanúgy fut rajta minden 32 bites app, és driver is ugyanúgy van rá."
Hát, én nem egészen ezt hallottam eddig: nem mindenhez van driver (ezt el is hiszem), és pár dolog nem fut rendesen. De ha nem így van, az jó.
"Az elég ütős lenne. Tudsze erről valami pontosabbat?"
PPC 970GX, >3GHz, kisebb hőtermelés (90nm?). -
BiroAndras #390 "Nos, lehet, hogy a srác jól programozik pc-n, de úgy tűnik, tipikus pc-kocka, akinek minden, ami más, mint a megszokott egyszerű felállás, alapból "szar"."
Tehát, aki nem ért egyet veled (más nem tudsz róla), az mindenképpen csak hülye lehet.
Egyébként, ha nem figyeltél volna, 3D-t programozott, amibe erősen beletartozik a GPU programozása is, ami meg jobban hasonlít a cell-re, mint az x86-okra.
"Az illető cég helyében én két lábbal rúgnám ki, ha meghallanám, hogy így áll hozzá..."
Nos, az ileltő cég maga a Sony. És nem nem igazán akarják kirúgni.
"Mivel vélhetően úgysem fog igazán jó kódot csinálni."
Hát, nálunk olyan 3D motort csinált, ami lealázta a konkurenciát.
"Az ilyet amúgy is utálom, mert nekem kellene a helyében lennem.
Ja, így már értem. Mi akadályoz meg téged, hogy a helyében legyél? Ha olyan jó vagy, akkor ez nem okozhat gondot.
Egyébként mint mondtam nem csak ő van rossz véleménnyel a PS3-ról és az XBox-ról, hanem az összes programozónk, akivel beszéltem. De hasonló panaszokat hallottam azoktól a fejlesztőktől is, akik már dolgoznak rajtuk. -
BiroAndras #389 "De úgy tűnik mégsem láttad azokat a játékokat, amikről beszéltem."
Akkor kivételesen mondhatnál valami konkrétumot. -
BiroAndras #388 "Te magad is írtad máshol, hogy jópár más feladat is van még azon kívül, és ezek szépen futhatnak külön szálakon."
Igen, de ezek jó része az SPE-ken fog futni. De tényleg van olyan, ami mehet itt.
"De amúgy is a többszálúsítás a jövő, nem csak itt, pc-n is erre kell ráállni game-motor téren is."
Igen, csakhogy ez nem egy egyszerű folyamat. PC-n egy mag se lassabb, mint a régebbiek, így ha ki nek is használják, legalább visszaesés nincs.
És használhatók a megszokott programozási technikák, és optimalizációk, csaupán a többszálúsításra kell figyelni.
"Azért talán van, ugyanis a RISC azon alapul, hogy egyszerűbbek az utasítások, így nincs szükség annyi lépésre a dekódoláshoz."
"Igen, szerintem is default 64 bitesnek kellett volna lennie a Vistának, és csak mint special edition jöhetett volna inkább a 32 bites verzió."
A 32 és 64 bites verzió közt nincs más különbség. Tehát akinek 64 bites procija van, annak értelmetlen 32 biteset használni. Ugyanúgy fut rajta minden 32 bites app, és driver is ugyanúgy van rá.
"Viszont ez nem lett volna azért annyira zökkenőmentes, mivel a 64 bites XP-n is jópár 32 bites program nem futott rendesen"
Elvben nem lassulnak észrevehetően a 32 bites progik. Sőt akár gyorsulhatnak is a jobb memóriakezelés, meg egyebek miatt.
"Pedig egy ideje éppen ilyesmit is gyárt az IBM, saját szervereibe."
Az elég ütős lenne. Tudsze erről valami pontosabbat? -
dez #387 Nos, lehet, hogy a srác jól programozik pc-n, de úgy tűnik, tipikus pc-kocka, akinek minden, ami más, mint a megszokott egyszerű felállás, alapból "szar". Az ilyen minek megy PS3-kódernek? Az illető cég helyében én két lábbal rúgnám ki, ha meghallanám, hogy így áll hozzá... Mivel vélhetően úgysem fog igazán jó kódot csinálni. Az ilyet amúgy is utálom, mert nekem kellene a helyében lennem. :) -
dez #386 De úgy tűnik mégsem láttad azokat a játékokat, amikről beszéltem. -
dez #385 "Ahhoz meg több szálon kéne futni, nem?"
Igen, de nem feltétlenül a game-motor magjának. Te magad is írtad máshol, hogy jópár más feladat is van még azon kívül, és ezek szépen futhatnak külön szálakon. De amúgy is a többszálúsítás a jövő, nem csak itt, pc-n is erre kell ráállni game-motor téren is.
"Ilyet sose mondtam. Azt mondtam, hogy a tervezési filozófia hasonló lehetett."
Lehetett távoli hasonlóság, de az IBM okosabb, mint az Intel, több alap-kutatást végez, jobban tudhatta, hogy az úgy nem nagyon fog menni. Amúgy sem arra törekedtek, hogy már korábban is minnél magasabb legyen az órajel, miközben a teljesítmény semmivel sem nagyobb (nem akartak ezzel senkit félrevezetni), csak hogy jópár évvel később érje - talán - utól magát a dolog.
"Nem vagyok benne biztos, hogy ennek a megkülönböztetésnem van még értelme, de mindegy."
Azért talán van, ugyanis a RISC azon alapul, hogy egyszerűbbek az utasítások, így nincs szükség annyi lépésre a dekódoláshoz. Persze itt már van SIMD is, ami ebbe kicsit belezavar.
"Nem reklamálok, csak mondom, hogy miért nem terjedt el a 64-bitres win. A Vista esetén ilyen körülmény nem áll fent. A júzer szempontjából nincs hátránya a 64-bitnek, előnye viszont van (pl. már ma is gyakran kevés a 2GB címtartomány), és egyre több lesz idővel."
Igen, szerintem is default 64 bitesnek kellett volna lennie a Vistának, és csak mint special edition jöhetett volna inkább a 32 bites verzió. Viszont ez nem lett volna azért annyira zökkenőmentes, mivel a 64 bites XP-n is jópár 32 bites program nem futott rendesen (a driverek mellett, amikből viszont Vistán amúgy is új kell - ha csak ezekkel lett volna gond, egyszerűbb lenne a helyzet).
"Hát bizonyos esetekben esetleg lehet jobb, de általában nem az. Egy tipikus egy szálon futó gamelogic kód szerintem semmi hasznát nem veszi."
Az nem, de azok felett amúgy is egyre inkább eljár az idő, és amellett van más feladat is, ami mehet külön szál(ak)on.
"Annál inkább kéne neki a többi kidobot fícsör (ebből a szempontból egy 386-oshoz hasonlít tudásban)."
Ezt túlzásnak érzem.
"Volt arról szó, hogy a 3.2Ghz-et nem tudják tartani a PS3-nál."
Az csak rémhír volt, és amúgy is a hűtéssel kapcsolatos, nem azzal, mit bír a chip.
"Egyébként a G5-tel nem lehet egy az egyben összehasonlítani, mert nem konkrétan abból lett butítva. Szóval a relatív frekvencia nem feltétlen tükrözi a teljesítmény viszonyokat. Nyílván, ha egy G5 mag képes lenne 3-4GHz-re akkor gyártanának olyat."
Pedig egy ideje éppen ilyesmit is gyárt az IBM, saját szervereibe. Úgy tűnik, eleve nem is akarták odaadni az Apple-nek. A számát most nem tudom. -
dez #384 "Hát nem igazán. Pont az a lényeg, hogy nem tudom előre, hogy honnan fog kelleni az adat. Ez a számolás közben derül ki."
Nos ez a korábban taglalt 3. eset lenne, de itt az 1. esetről beszéltünk.
"Akkor nem érted amit mondok. Nem a poligonszám érdekes. Az főként a rendert lassítja. A lényeg az, hogy a gamelogic 2D-ben nagyságrenddel egyszerűbb lehet, mint 3D-ben."
Én is épp erről beszélek. Olyan játékokról, ahol már szintén nem csak a megjelenítés volt 3D-s.
"Ehhez jön még hozzá, hogy ha már szép 3D a környezet, akkor már elvárják, hogy viselkedjen is valósághűen (pl. a szélben mozogjanak a fák, lobogjanak a zászlók, meg csillió ilyen CPU és RAM zabáló apróság)."
Ez már "újgenerációs" dolog, hiszen régen eleve nem lehetett annyi poligon, amennyi ehhez kell.
"Na persze, sokkal kisebb térképen, sokkal kevesebb extra adattal. Emlékeim szerint a legtöbb RTS-nek nem volt túl jó útkeresője."
Kissé keverednek itt a dolgok, itt nem a régi játékokról volt szó, hanem a SPE-kről. :)
"Mert nem kivételekről beszélünk. Én legalábbis nem."
Ejj, te nem, én viszont igen, lévén arról beszéltem, hogy voltak kivételek. Tudod, néha a másik ember is mond valamit, és ha értelmesen akarsz beszélgetni, akkor oda kell figyelni, mit is mond. :)
"Sok millió != 100 millió. És nem 60 FPS, csak 20-30. Tehát pár száz millió műveletről van szó."
20-30fps kevés. Elég tré lenne egy olyan játék, ami sosem megy többet ennyinél. De mindegy, pár százmillió művelet is túl nagy terhelés lenne egy fejlett x86-nak is, mivel más dolga is van.
"Azért nem egészen."
Jó esetben igen.
"Persze csak akkor ugye a max. teljesítmény nem 256GFlops, hanem jóval kevesebb."
Nem túl optimális egy-egy adattal dolgozni SIMD környezetben, ebben nincs semmi meglepő.
"Hogy közömbösíthető? Eddig nem igazán sikerült senkinek."
Dehogynem. Már írtam: párhuzamosan több feladat végzése. Ilyenkor nem holt idő a késleltetés miatti várakozás. (Ez pl. a gpgpu-s doksikban is szépen le van írva, ha nem hiszed.) -
BiroAndras #383 Volt itt valamelyik nap egy srác, aki pár hónapja ment el tőlünk a Sony-hoz Angliába. PS3-ra fejleszt. Én sajnos nem tudtam vele erről beszélni, de a többiek azt mondták, hogy szerinte se igazán jó (konkrétan a "szar" kifejezés hangzott el). És hogy mennyire tud ő programozni (eltekintve attól, hogy a Sony felvette)? Nos, ő írta a 3D motorunk nagy részét, ami nagyon jó.
Az X360-ról meg egy egész előadás volt, amire sajnos nem tudtam elmenni, de majd menézem videóról, ha lesz időm. Pár érdekességet emséltek róla a többiek. Pl.: A float műveletek gyorsak, de az összehasonlítás rettenetesen lassú. Az int-eknél meg a műveletek lassúak és az összehasonlítás gyors. Az int<->float konverzió pedig gyors, kivéve, ha azonnal felhasználod az eredményt, mert akkor nagyon lassú. Izgalmas lesz erre optimalizálni. -
BiroAndras #382 "és te talán nem is hinnéd, hogy egy akkori, a maiaknál több nagyságrenddel kisebb teljesítményű gép is elboldogult velük."
Már hogy ne hinném, amikor saját szememmel láttam? Mondtam, hogy C16-on kezdtem programozni. Láttam, hogy mit ki lehetett hozni azokból a gépekből. De ugyanígy láttam azt is, hogy mennyivel egyszerűbb volt minden akkor. -
BiroAndras #381 "Ez HW SMT-s, a G5 nem."
Ahhoz meg több szálon kéne futni, nem?
"Még 1x: nem hiszem, hogy pont az IBM másolta volna az Intelt."
Ilyet sose mondtam. Azt mondtam, hogy a tervezési filozófia hasonló lehetett.
"Továbbá egész más architektúra, az egyik alapvetően CISC, a másik meg RISC."
Nem vagyok benne biztos, hogy ennek a megkülönböztetésnem van még értelme, de mindegy.
"A MS-nál reklamálj..."
Nem reklamálok, csak mondom, hogy miért nem terjedt el a 64-bitres win. A Vista esetén ilyen körülmény nem áll fent. A júzer szempontjából nincs hátránya a 64-bitnek, előnye viszont van (pl. már ma is gyakran kevés a 2GB címtartomány), és egyre több lesz idővel.
"Meg be is tettek a HW SMT érdekében. Úgy gondolták, az fontosabb."
Hát bizonyos esetekben esetleg lehet jobb, de általában nem az. Egy tipikus egy szálon futó gamelogic kód szerintem semmi hasznát nem veszi. Annál inkább kéne neki a többi kidobot fícsör (ebből a szempontból egy 386-oshoz hasonlít tudásban).
"Nem. A leggyorsabb G5 2GHz körül megy. A Cell meg 4GHz-en is képes üzemelni, a PS3-ban speciel 3.2GHz-en megy."
Volt arról szó, hogy a 3.2Ghz-et nem tudják tartani a PS3-nál.
Egyébként a G5-tel nem lehet egy az egyben összehasonlítani, mert nem konkrétan abból lett butítva. Szóval a relatív frekvencia nem feltétlen tükrözi a teljesítmény viszonyokat. Nyílván, ha egy G5 mag képes lenne 3-4GHz-re akkor gyártanának olyat. -
BiroAndras #380 "Megteheted, hogy a PPE-vel összeszeded az adatokat sok helyről egy helyre"
Hát nem igazán. Pont az a lényeg, hogy nem tudom előre, hogy honnan fog kelleni az adat. Ez a számolás közben derül ki.
""Ismétlem : nem a grafikáról beszélek, hanem a 3D környezetről."
Ha nem lett volna egyértelmű: én is."
Akkor nem érted amit mondok. Nem a poligonszám érdekes. Az főként a rendert lassítja. A lényeg az, hogy a gamelogic 2D-ben nagyságrenddel egyszerűbb lehet, mint 3D-ben. Ehhez jön még hozzá, hogy ha már szép 3D a környezet, akkor már elvárják, hogy viselkedjen is valósághűen (pl. a szélben mozogjanak a fák, lobogjanak a zászlók, meg csillió ilyen CPU és RAM zabáló apróság).
"Olyan nagyon sokat nem hiszem. Ez olyasmi, mint egy fillező algoritmus - nos egy ZX80 is elboldogult az ilyesmivel a párkás ramjával."
Na persze, sokkal kisebb térképen, sokkal kevesebb extra adattal. Emlékeim szerint a legtöbb RTS-nek nem volt túl jó útkeresője.
A körökre osztott játékoknál meg ugye nem kell magyaráznom, hogy mennyivel egyszerűbb a dolog.
"Ha a kivételekről beszélünk, akkor miért lenne az átlag a lényeg?"
Mert nem kivételekről beszélünk. Én legalábbis nem.
"Aha, persze. Egy gyors x86 CPU sem boldogulna ennyivel: mondjuk 100 millió * 60 (fps) = 6 milliárd művelet..."
Sok millió != 100 millió. És nem 60 FPS, csak 20-30. Tehát pár száz millió műveletről van szó.
"A késleltetést meg közömbösíti a párhuzamos feladatvégzés."
Azért nem egészen.
"Na, akkor most egy SPE nem lesz fullosan kihasználva, nem nagy dolog."
Persze csak akkor ugye a max. teljesítmény nem 256GFlops, hanem jóval kevesebb.
""Nem a sávszélesség a lényeg, hanem a késleltetés."
Ami közömbösíthető."
Hogy közömbösíthető? Eddig nem igazán sikerült senkinek. -
dez #379 Ehh, nyilván én sem azt mondtam, hogy egy súlycsoportban voltak komplexitásban, hanem azt, hogy voltak az átlagnál összetettebb játékok (nem csilivili grafikában), és te talán nem is hinnéd, hogy egy akkori, a maiaknál több nagyságrenddel kisebb teljesítményű gép is elboldogult velük. -
dez #378 "A cell-nél meg az integrált RAM eszik sok tranyót."
Tévedés: kb. az 1/8-át. Nem pedig a felét, vagy még többet, mint x86-nál a L2-L3.
"A cell PPE-je a G5-nél is sokkal egyszerűbb."
Bizonyos dolgokban egyszerűbb, más dolgokban összetettebb. Ez HW SMT-s, a G5 nem.
"Ennyire nem vagyok járatos a témában, de logikusnak tűnik, hogy az egyszerűbb felépítés azt jelenti, hogy az utasításokat jobban szét kell bontani, vagyis hosszabb a futószalag. És ne felejtsd el, hogy a cell-t is a akkoiban kezdték tervezni, amikor a P4 kijött, és akkor még mindenki azt hitte, hogy 2000-re 10Ghz-es procik lesznek."
Még 1x: nem hiszem, hogy pont az IBM másolta volna az Intelt. Továbbá egész más architektúra, az egyik alapvetően CISC, a másik meg RISC.
"Konkréten nem tudom milyen hosszú, de azt írták, hogy az, és gondolom nem nehéz két kicsi számot összehasonlítani. Tudsz konkrét számokat?"
Nem, és most nincs is időm utánanézegetni.
"Értelmetlen lenne 64 bites procin 32 bites OS-t használni, amikor a 64-bitesnek gyakorlatilag csak előnye van. A 64 bites XP egy évet késett, és addigra már mindenki kiábrándult belőle, és a Vistát várta, eézrt nem terjedt el."
A MS-nál reklamálj...
"Nem túlzás, jelentős mennyiségű logikát szedtek ki belőle."
Meg be is tettek a HW SMT érdekében. Úgy gondolták, az fontosabb.
"Az órajelet meg mintha épp csökkentették volna, nem?"
Nem. A leggyorsabb G5 2GHz körül megy. A Cell meg 4GHz-en is képes üzemelni, a PS3-ban speciel 3.2GHz-en megy. -
dez #377 "PPE<->SPE"
Megteheted, hogy a PPE-vel összeszeded az adatokat sok helyről egy helyre (elhanyagolható idő alatt), és azt - ugyancsak egy pillanat alatt - beolvastatod blokkosan egy SPE-vel.
"Ismétlem : nem a grafikáról beszélek, hanem a 3D környezetről."
Ha nem lett volna egyértelmű: én is.
"Sajnos nem. Még maga a térkép talán, de a keresés maga is jó sok memóriát igényel."
Olyan nagyon sokat nem hiszem. Ez olyasmi, mint egy fillező algoritmus - nos egy ZX80 is elboldogult az ilyesmivel a párkás ramjával.
"Lényeg : Régi átlag játék sokkal AI-ja egyszerűbb (vagy nincs is), mint mai átlag játék."
Ha a kivételekről beszélünk, akkor miért lenne az átlag a lényeg?
"Ahányszor még megpróbálod kimagyarázni, hogy de mégsem úgy van."
Inkább te próbálsz bemagyarázni dolgokat... :P
"Igen."
Aha, persze. Egy gyors x86 CPU sem boldogulna ennyivel: mondjuk 100 millió * 60 (fps) = 6 milliárd művelet...
"Nem kell millió ahhoz, hogy 256K RAM elfogyjon. A gráf pontjai általában 1 Byte-nál jóval nagyobbak. Nálunk pl. most épp 44Byte (igaz, ennek fele csak a számolások gyorsítása miatt van tárolva)."
Mindegy, akkor majd csinálja a PPE. Ez x86-on is az idő kis részét teszi ki, itt sem lehet gond. (A késleltetést meg közömbösíti a párhuzamos feladatvégzés.)
"Az, hogy "nem sok adattal egyszerre" máris azt jelenti, hogy a téynleges teljesítmény töredéke az elméleti maximumnak."
Na, akkor most egy SPE nem lesz fullosan kihasználva, nem nagy dolog.
"Nem a sávszélesség a lényeg, hanem a késleltetés."
Ami közömbösíthető. -
BiroAndras #376 "A Windowsos exe-k mindig is sokkal többet foglaltak, még ha ugyanazt is csinálták."
Ismétlem : "Persze ez sokmindentől függ, de azért a pár száz KB a 10MB-vel nincs egy súlycsoportban."
De ha ez nem győz meg, nézd meg a fejlesztési időket, és költségeket. Akik régebben vannak a cégnél, azok is azt mondják, hogy akár 3-4 évvel ezelőtt is kb. egy nagyságrenddel kevésbbé komplexek voltak a játékok (nem játékmenetben, hanem kódban). -
BiroAndras #375 "Messze nem csak ettől. Pentiumok esetén a tranyók nagy része a L2-L3 cache-ban foglal helyet."
A cell-nél meg az integrált RAM eszik sok tranyót.
"Továbbá, a G5 is jóval kevesebb tranzisztorral beéri"
A cell PPE-je a G5-nél is sokkal egyszerűbb.
"Persze, majd biztos a P4-ről másolták..."
Ennyire nem vagyok járatos a témában, de logikusnak tűnik, hogy az egyszerűbb felépítés azt jelenti, hogy az utasításokat jobban szét kell bontani, vagyis hosszabb a futószalag. És ne felejtsd el, hogy a cell-t is a akkoiban kezdték tervezni, amikor a P4 kijött, és akkor még mindenki azt hitte, hogy 2000-re 10Ghz-es procik lesznek.
"Nem olyan hosszú az a futószalag."
Konkréten nem tudom milyen hosszú, de azt írták, hogy az, és gondolom nem nehéz két kicsi számot összehasonlítani. Tudsz konkrét számokat?
"Mellesleg mi az, hogy "nem nagyon"? Aki 32 bites OS-t futtat (98%), az egyátalán nem."
Na, ezt jelenti a nem nagyon.
"Nem igazán, abból is lesz 32 bites és 64 bites, és a többség továbbra is a 32 biteset fogja használni."
Értelmetlen lenne 64 bites procin 32 bites OS-t használni, amikor a 64-bitesnek gyakorlatilag csak előnye van. A 64 bites XP egy évet késett, és addigra már mindenki kiábrándult belőle, és a Vistát várta, eézrt nem terjedt el.
"Szerintem az "erősen" az túlzás. És ne feledd az órajelemelést sem."
Nem túlzás, jelentős mennyiségű logikát szedtek ki belőle. Az órajelet meg mintha épp csökkentették volna, nem? -
BiroAndras #374 "Milyen másolgatással?"
PPE<->SPE
"Te olvasol is néha, vagy csak hányod a szavakat?"
Ezt én is kérdezhetném tőled.
"Ismétlem: én is 3D-ről beszéltem, csak nem csillió poligonnal."
Ismétlem : nem a grafikáról beszélek, hanem a 3D környezetről.
"Egy ilyen négyzetrácsos tábla beférhet akár 1-2 SPE ramjába is."
Sajnos nem. Még maga a térkép talán, de a keresés maga is jó sok memóriát igényel.
"Igen, a legtöbb régi játékban nem volt AI, de mint írtam, voltak kivételek."
Lényeg : Régi átlag játék sokkal AI-ja egyszerűbb (vagy nincs is), mint mai átlag játék.
"Hányszor fogjuk ezt is még újraiterálni?"
Ahányszor még megpróbálod kimagyarázni, hogy de mégsem úgy van.
"Sokmilliónyi? (Frémenként!?)"
Igen.
"És amúgy mihez kell milliós elemszámú gráf?"
Nem kell millió ahhoz, hogy 256K RAM elfogyjon. A gráf pontjai általában 1 Byte-nál jóval nagyobbak. Nálunk pl. most épp 44Byte (igaz, ennek fele csak a számolások gyorsítása miatt van tárolva).
"Mást is egy ciklus alatt csinál, csak annyi, hogy nem sok adattal egyszerre."
Az, hogy "nem sok adattal egyszerre" máris azt jelenti, hogy a téynleges teljesítmény töredéke az elméleti maximumnak.
"Aha, hát persze, ha nem 50GB/s a hozzáférés, csak 25GB/s, akkor összedől a világ..."
Nem a sávszélesség a lényeg, hanem a késleltetés. -
BiroAndras #373 2 hétig nem leszek. Majd folyt. köv. -
dez #372 A Windowsos exe-k mindig is sokkal többet foglaltak, még ha ugyanazt is csinálták. -
dez #371 "Ettől lesz sokkal egyszerűbb. Nézd meg a tranzisztorszámokat."
Messze nem csak ettől. Pentiumok esetén a tranyók nagy része a L2-L3 cache-ban foglal helyet. Továbbá, a G5 is jóval kevesebb tranzisztorral beéri, mint akár a Pentium cache nélkül számolva. Ebben nem kis szerepe van az x86 arch. elavultságának, és ennek kompenzálására kifejlesztett dolgoknak.
"Plusz még ehhez jön a hosszú futószalag, ami már a P4-ek esetén egyszer csődöt mondott (a cell-t kb. akkor kezdték tervezni, amikor a p4 kijött)."
Persze, majd biztos a P4-ről másolták... :P Nem olyan hosszú az a futószalag.
"Az A64 is 64 bites, csak eddig nem nagyon használták ki"
És? Ki mondta, hogy nem? Mellesleg mi az, hogy "nem nagyon"? Aki 32 bites OS-t futtat (98%), az egyátalán nem.
"(majd a Vista ebben is segít)."
Nem igazán, abból is lesz 32 bites és 64 bites, és a többség továbbra is a 32 biteset fogja használni.
"A többi meg jó dolog, csak nem biztos, hogy elegek. Ezt mérések nélkül nehéz eldönteni (az egyszerűbb felépítésről van tapasztalat, hiszen a régi procik olyanok voltak)."
Csak épp ne hasonlítsd 1:1-ben a régebbi x86-osokhoz. (Főleg hogy azokban HW-SMT sem volt soha.)
"A cell PPE-je nem G5, hanem egy erősen butított változata."
Szerintem az "erősen" az túlzás. És ne feledd az órajelemelést sem. -
dez #370 "Tehát ennyit veszítessz a másolgatással."
Milyen másolgatással?
" "Hát ez az, hogy 10-20 MHz-ből is sokat ki lehet hozni."
Sokat, de messze nem annyit, mint 3GHz-ből. Nem tudom mit kell ezen magyarázni."
Ezen? Semmit. Éppen azt mondom, hogy a 3GHz milyen sok is, ha nincs elhasználva mindenféle kiegészítő műveletre.
"Nem a poligonok számáról van szó, hanem arról, hogy egy 3D vektoros világot kezelni sokkal bonyolultabb, mint egy 2D négyzetrácsosat. Pl. megállapítani, hogy mire klikkelt a júzer."
Te olvasol is néha, vagy csak hányod a szavakat? Ismétlem: én is 3D-ről beszéltem, csak nem csillió poligonnal.
"Hanem?"
Amit írtam, már előbb is, meg fentebb is.
"Más algoritmusoknál probléma a méret. Pl. itt is lehet négyzetrácsa leképezni, és azon keresni (RTS-eknél gyakori)."
Egy ilyen négyzetrácsos tábla beférhet akár 1-2 SPE ramjába is.
"Csak nézd meg a régebbi játékokat. A régi RTS-ekben pl. nem volt AI, hanem az ellenfélnek a pályaépítők rakták le az épületeit, és állították be a gyártást, és a kész egységeket egyszerűen ellened küldte a gép. A mostani játékunkban viszont az AI maga épít fel mindent, gyűjt erőforrást, kitalálja, hogy mit kell gyártani, az egységekből csapatokat képez, megkeresi a védelmed gyenge pontjait, stb."
Igen, a legtöbb régi játékban nem volt AI, de mint írtam, voltak kivételek. Hányszor fogjuk ezt is még újraiterálni?
" "Egy játék esetén hol kell sokmilliónyi hozzáférés ilyenekben?"
Útkeresés, AI."
Sokmilliónyi? (Frémenként!?)
"Nem, mert nem tudható előre, hogy a gráf melyik pontja kell majd legközelebb.
Mondjuk valamilyen szinten megoldható, ha nem túl nagy a gráf (pl. valamilyen módszerrel szektorokra bontjuk)."
Nalátod. És amúgy mihez kell milliós elemszámú gráf?
"De akkor is ott van még az a probléma, hogy az SPE-k teljesítménye SIMD utasításokra van megadva, más jellegű feladatoknál lényegesen lassabbak."
Mást is egy ciklus alatt csinál, csak annyi, hogy nem sok adattal egyszerre.
"Ha lassabb, akkor már rég rossz."
Aha, hát persze, ha nem 50GB/s a hozzáférés, csak 25GB/s, akkor összedől a világ... :P -
BiroAndras #369 Ja, és persze abban a 10 megában még nincs benne egy nagy halom DLL -
BiroAndras #368 Még a komplexitásról : Érdemes megnézni pl. az exe méret különbségeket. Persze ez sokmindentől függ, de azért a pár száz KB a 10MB-vel nincs egy súlycsoportban. -
BiroAndras #367 "Egyrészt nem olyan sokkal egyszerűbb, csak mert in-order, és nem olyan kifinomult a branch-prediction."
Ettől lesz sokkal egyszerűbb. Nézd meg a tranzisztorszámokat.
Plusz még ehhez jön a hosszú futószalag, ami már a P4-ek esetén egyszer csődöt mondott (a cell-t kb. akkor kezdték tervezni, amikor a p4 kijött).
"Viszont több általánosan használható regiszter van, mint akár AMD64-ben, HW SMP-s, 64 bites, stb."
Az A64 is 64 bites, csak eddig nem nagyon használták ki (majd a Vista ebben is segít). A többi meg jó dolog, csak nem biztos, hogy elegek. Ezt mérések nélkül nehéz eldönteni (az egyszerűbb felépítésről van tapasztalat, hiszen a régi procik olyanok voltak).
"Meg figyu: tudod, mennyivel gyorsabb az új Core Duo-s Mac a dual-G5-ös PowerMac-eknél? Átlagosan 1,5-2x... Akkor ehhez most add hozzá, hogy azok még a korábbi fejlesztésű 2GHz körüli G5-ök voltak."
A cell PPE-je nem G5, hanem egy erősen butított változata. -
BiroAndras #366 "A 100000 művelet van meg egytízezred mp alatt."
Tehát ennyit veszítessz a másolgatással.
"Hát ez az, hogy 10-20 MHz-ből is sokat ki lehet hozni."
Sokat, de messze nem annyit, mint 3GHz-ből. Nem tudom mit kell ezen magyarázni.
"Én is 3D-ről beszélek. Az, hogy sokkal több a poligon, nem feltétlenül növeli annyival a komplexitást, csak a proci (és a GPU) terhelését."
Nem a poligonok számáról van szó, hanem arról, hogy egy 3D vektoros világot kezelni sokkal bonyolultabb, mint egy 2D négyzetrácsosat. Pl. megállapítani, hogy mire klikkelt a júzer.
"Én sem ilyen egyszerű táblás játékokról beszélek."
Hanem?
"Ha távolságokat mérnek, akkor oly mindegy, hogy egy nagyobb vagy egy kisebb poligont metsz a próbált iránysugár."
Más algoritmusoknál probléma a méret. Pl. itt is lehet négyzetrácsa leképezni, és azon keresni (RTS-eknél gyakori).
"Azért buta a többség, mert lusták (ohh, bocs, nincs elég idejük) jobbat csinálni. De ebből nem következik, hogy régebben még butábbak voltak."
Csak nézd meg a régebbi játékokat. A régi RTS-ekben pl. nem volt AI, hanem az ellenfélnek a pályaépítők rakták le az épületeit, és állították be a gyártást, és a kész egységeket egyszerűen ellened küldte a gép. A mostani játékunkban viszont az AI maga épít fel mindent, gyűjt erőforrást, kitalálja, hogy mit kell gyártani, az egységekből csapatokat képez, megkeresi a védelmed gyenge pontjait, stb.
"Egy játék esetén hol kell sokmilliónyi hozzáférés ilyenekben?"
Útkeresés, AI.
"Szerintem ott létrehozhatók pártíz KB-os adatmezők, amik szépen elférnek egy SPE local ramjában."
Nem, mert nem tudható előre, hogy a gráf melyik pontja kell majd legközelebb.
Mondjuk valamilyen szinten megoldható, ha nem túl nagy a gráf (pl. valamilyen módszerrel szektorokra bontjuk). De akkor is ott van még az a probléma, hogy az SPE-k teljesítménye SIMD utasításokra van megadva, más jellegű feladatoknál lényegesen lassabbak.
"Ja, arról még nem is beszéltünk, hogy valószínűleg egy SPE láthatja a többi ramját is, csak az azokhoz való hozzáférés lassabb"
Ha lassabb, akkor már rég rossz. -
dez #365 "Nem hülyeség. A feladattól függően nagyon sokat számíthat a sokkal egyszerűbb felépítés."
Egyrészt nem olyan sokkal egyszerűbb, csak mert in-order, és nem olyan kifinomult a branch-prediction. Viszont több általánosan használható regiszter van, mint akár AMD64-ben, HW SMP-s, 64 bites, stb.
Meg figyu: tudod, mennyivel gyorsabb az új Core Duo-s Mac a dual-G5-ös PowerMac-eknél? Átlagosan 1,5-2x... Akkor ehhez most add hozzá, hogy azok még a korábbi fejlesztésű 2GHz körüli G5-ök voltak.
" "Más feladatnál a CPU is gyengébb, mert ott is SIMD-ből jön a FLOPS nagy része."
Ezért nem a flops-ot nézzük."
Értelemszerűen más számítási feladatról beszélek, mivel (továbbra is) FLOPS-ról beszéltem. Csak olyanról, amihez nem passzol a SIMD, hanem az FPU-t kell használni. Apropó, a Power procik FPU-ja is elég erős.
Tehát, SIMD SIMD-el eléggé összehasonlítható. (Mellesleg az SPE nem csak egy SIMD egység, hanem egy vektorprocimag, szóval más utasítások is vannak.)
" "Más dolgokban sem teljesen pontosak."
Pl.?"
Most nem fogom itt kielemezni az egészet.
"Egyébként mintha lett volna egy cikk nemrég, ami arról szólt, hogy a wiki legalább olyan megbízható, mint az Encyclopaedia Britannica."
Ez egy általánosítás, vannak alóla kivételek. -
dez #364 " "Aha, csak épp "lassan" is megvan egytízezred mp alatt."
Az rettenetesen lassú. Az adattal végzett művelet nanosec nagyságrendű."
Igen, és 100000 x 10^-9 = 0,0001. A 100000 művelet van meg egytízezred mp alatt.
"A cikkben leírják szépen, hogy mi a probléma. Nagyon sokat számítanak ám ezek a dolgok az ilyen típusú feladatoknál."
(Gondolom, a másik topikban általad linkelt cikkről beszélsz.)
Nos, igen, leírják, és jól el is túlozzák.
"Igen, de az a plusz teljesítmény nagyrészt elveszik."
Dehogy veszik el a nagy része, ne beszélj már zöldségeket.
"Megint személyeskedsz érvelés helyett."
Hol van itt személyeskedés? Úgy véled, minden játékot ismertél talán, és sértés azt mondani, hogy nem?
"Nem lehettek oylan összetett játékok, mivel nem volt elég erőforrás hozzá"
Önigazoló érv... Hát ez az, hogy 10-20 MHz-ből is sokat ki lehet hozni.
"és egyébként is a komplexitás jelentős része a 3D világból adódik. Az AI munkáját is drasztikusan megnehezíti a komplexebb környezet."
Én is 3D-ről beszélek. Az, hogy sokkal több a poligon, nem feltétlenül növeli annyival a komplexitást, csak a proci (és a GPU) terhelését.
"És ott van még pl. az útkeresés. Négyzetrácsos térképen azonos (1 négyzetnyi) méretű egységekkel, nagyságrendekkel egyszerűbb, mint 3D poligonos világban különféle méretű egységekkel. Ráadásul itt a járművek ív mentén kanyarodnak, és ki is kell hogy kerüljék egymást."
Én sem ilyen egyszerű táblás játékokról beszélek. Mellesleg az útkeresés ma sem "mm-es" pontosságú. Bár attól függ, hogy csinálják. Ha távolságokat mérnek, akkor oly mindegy, hogy egy nagyobb vagy egy kisebb poligont metsz a próbált iránysugár.
Mellesleg komolyabb géphez több poligon, és ezzel némileg több ilyen távolságmérési (vagy egyéb) lépés dukál, ez nem csoda. De itt az intelligencia intelligensségéről van szó.
"Attól is függ, hogy melyik játék (pl. nézd meg a Black&White-ot). A többség sajnos tényleg elég buta (de régen még butábbak voltak)."
Azért buta a többség, mert lusták (ohh, bocs, nincs elég idejük) jobbat csinálni. De ebből nem következik, hogy régebben még butábbak voltak.
"És messze nem biztos, hogy kevés ilyen lesz. Pl. a gráf algoritmusok gyakran ilyenek (AI, útkeresés)."
Egy játék esetén hol kell sokmilliónyi hozzáférés ilyenekben? Szerintem ott létrehozhatók pártíz KB-os adatmezők, amik szépen elférnek egy SPE local ramjában. (Ja, arról még nem is beszéltünk, hogy valószínűleg egy SPE láthatja a többi ramját is, csak az azokhoz való hozzáférés lassabb - de még mindig épp elég gyors -, mint a sajátjához.) -
BiroAndras #363 "Ez nem igaz. Csak arról van szó, hogy egy 3.2GHz-es PPE nem ér fel egy 3.2GHz-es x86-tal, de az hülyeség, hogy egy átlagos, mondjuk 2GHz-es x86-nál is sokkal gyengébb."
Nem hülyeség. A feladattól függően nagyon sokat számíthat a sokkal egyszerűbb felépítés.
"Más feladatnál a CPU is gyengébb, mert ott is SIMD-ből jön a FLOPS nagy része."
Ezért nem a flops-ot nézzük.
"Más dolgokban sem teljesen pontosak."
Pl.?
"Talán nem kellene mindenben és kizárólag a wikire hagyatkozni."
Hol hagyatkozom kizárólag arra?
Egyébként mintha lett volna egy cikk nemrég, ami arról szólt, hogy a wiki legalább olyan megbízható, mint az Encyclopaedia Britannica. -
BiroAndras #362 "Aha, csak épp "lassan" is megvan egytízezred mp alatt."
Az rettenetesen lassú. Az adattal végzett művelet nanosec nagyságrendű.
"Ne túlozz. Már-már úgy akarod beállítani, mintha L1-L2 sem lenne benne."
A cikkben leírják szépen, hogy mi a probléma. Nagyon sokat számítanak ám ezek a dolgok az ilyen típusú feladatoknál.
"PC-n az ideje nagy része másra megy el."
Igen, de az a plusz teljesítmény nagyrészt elveszik.
"Az általad leírt játékoknál régebben is voltak már "intelligensebbek", legfeljebb nem ismerted őket."
Megint személyeskedsz érvelés helyett. Nem lehettek oylan összetett játékok, mivel nem volt elég erőforrás hozzá, és egyébként is a komplexitás jelentős része a 3D világból adódik. Az AI munkáját is drasztikusan megnehezíti a komplexebb környezet. És ott van még pl. az útkeresés. Négyzetrácsos térképen azonos (1 négyzetnyi) méretű egységekkel, nagyságrendekkel egyszerűbb, mint 3D poligonos világban különféle méretű egységekkel. Ráadásul itt a járművek ív mentén kanyarodnak, és ki is kell hogy kerüljék egymást.
"A mai játékok "intelligenciája" sem igazán nyűgöz le, és ami azt illeti, még nagyon is előreprogramozottak a lépések"
Attól is függ, hogy melyik játék (pl. nézd meg a Black&White-ot). A többség sajnos tényleg elég buta (de régen még butábbak voltak).
"Ez a kvázi véletlenszerű hozzáférés esete, azaz a fennmaradó kicsi halmaza a feladatoknak, amiből speciális feladatoknál kell olyan sokat csinálni, hogy az gondot okozzon."
Pontosan erről beszélek. És messze nem biztos, hogy kevés ilyen lesz. Pl. a gráf algoritmusok gyakran ilyenek (AI, útkeresés). -
dez #361 (És akkor még nem számoltuk bele a true hw smp-t. [A GHz A64-re vonatkozott.]) -
dez #360 Igen, ha kevés adatot tolunk, akkor az már csak olyan sávszél, mint pc-n a csúcs. Hát igen, az milyen kevés is... -
dez #359 "Ami szintén sokkal egyengébb, mint egy átlag x86 CPU."
Ez nem igaz. Csak arról van szó, hogy egy 3.2GHz-es PPE nem ér fel egy 3.2GHz-es x86-tal, de az hülyeség, hogy egy átlagos, mondjuk 2GHz-es x86-nál is sokkal gyengébb.
"Elméletben, és csak SIMD műveleteknél. Más jellegű feladatoknál sokkal egyengébb."
Más feladatnál a CPU is gyengébb, mert ott is SIMD-ből jön a FLOPS nagy része.
"Simán elírták, előfordul. Ez nem változtat semmin."
Más dolgokban sem teljesen pontosak. Talán nem kellene mindenben és kizárólag a wikire hagyatkozni. -
dez #358 "Az lassú."
Aha, csak épp "lassan" is megvan egytízezred mp alatt.
"A sokkal gyengébb CPU miatt pont az arányok borulnak. Ami egy A64 3000+-on 10%, az a PPE-n könnyen lehet akár 100% is (de 30-50 biztosan)."
Ne túlozz. Már-már úgy akarod beállítani, mintha L1-L2 sem lenne benne.
"De gond, mert PC-n is az a gond, hogy nem jut neki elég teljesítmény. Ha a cell-en sem jut több, akkor gamelogic szinten nem lesznek jobbak a játékok."
PC-n az ideje nagy része másra megy el.
"Nagyságrendekkel összetettebbek."
Az általad leírt játékoknál régebben is voltak már "intelligensebbek", legfeljebb nem ismerted őket. A mai játékok "intelligenciája" sem igazán nyűgöz le, és ami azt illeti, még nagyon is előreprogramozottak a lépések, csak már nem olyan banálisan egyszerűen, mint korábban a legtöbb esetben. Ennel jóval intelligensebbek is lehetnek majd.
"Az SPE nem fér hozzá a PPE lokális memóriájához, így abban nem tud hatékonyan másolni."
+
"Erre mondtam, hogy az ilyen másolgatásos feladatok egyébként sem a PPE-n futnak, így az SPE besegítése a PPE-nek itt nem játszik."
A PPE-nek nem lokális memóriája van, hanem a szokásos L1-L2. Ahhoz tényleg nem fér hozzá az SPE, de attól még tud másolgatni a main memóriában, illetve a main és a vram között, így be tud segíteni a PPE-nek.
"De itt max. 1 tucat byte-ról van szó egy lépésben, és az azon végzett művelet dönti el, hogy melyik adat kell legközelebb. GOndolj pl. nagy gráfban keresésre (arra sincs semmi garancia, hogy a szomszédok egymáshoz közel vannak a memóriában)."
Ez a kvázi véletlenszerű hozzáférés esete, azaz a fennmaradó kicsi halmaza a feladatoknak, amiből speciális feladatoknál kell olyan sokat csinálni, hogy az gondot okozzon.
" "És ugye közben a 2. threadben más feladat is futhat a PPE-n."
Hiába, mert itt az SPE idejével van a gond."
Az SPE idejével?? A PPE ide való besegítésére fordított idejéről volt szó, tehát a PPE idejéről. (Mellesleg a PPE értesülése arró, hogy az SPE adatot vár, egy db bájt kiolvasása az SPE belső gyors ramjából.) -
BiroAndras #357 "Azt is nézd meg, mihez képest: max. sávszél itt 2-300 GB/s."
Pont arról van szó, hogy a gyakorlatban ez könnyen a töredékére csökkenhet, ami már összemérhető a PC-k sávszélességével. Abból jön ki ez a nagy szám, hogy az összes mag kommunikációját összeadják.
Az egész cell-re az a jellemző, hogy alapvetően erősnek lett szánva, de a költségek csökkentése miatt sok helyen erős kompromisszumokra kényszerültek, amik a teljesítményt is visszafoják. Szóval nagyon jó lesz ez bizonyos típusú feladatokra, de messze nem az a csodaszer, aminek reklámozták. -
BiroAndras #356 "Ehhez annyit, hogy miután van itt egy PPE is"
Ami szintén sokkal egyengébb, mint egy átlag x86 CPU.
"Aha, úgy nem 30x gyorsabb, csak 6x"
Elméletben, és csak SIMD műveleteknél. Más jellegű feladatoknál sokkal egyengébb.
"At 3.2 GHz, each SPE gives a theoretical 256 GFLOPS"
Simán elírták, előfordul. Ez nem változtat semmin. -
BiroAndras #355 "Hát úgy, hogy kiolvassa a memóriából azt a párszáz, párezer kis adatcsomagot, és átadja valamelyik SPE-nek (egy tízezred mp alatt)."
Az lassú.
""Emiatt nem biztos, hogy sokkal több marad a gamelogic-nak, mint PC-n."
Ez egy igen elhamarkodott következtetés, lásd arányok."
A sokkal gyengébb CPU miatt pont az arányok borulnak. Ami egy A64 3000+-on 10%, az a PPE-n könnyen lehet akár 100% is (de 30-50 biztosan).
"Oké, de mivel közben alig kell mással foglalkoznia a PPE-nek (más csinálja párhuzamosan), ez nem feltétlenül gond."
De gond, mert PC-n is az a gond, hogy nem jut neki elég teljesítmény. Ha a cell-en sem jut több, akkor gamelogic szinten nem lesznek jobbak a játékok.
"Kicsit besegíthet a PPE, de a számítások nagy része mehet az SPE-ken."
Erről nem vagyok meggyőződve, de elképzelhető.
"Na de hát ez az, hogy sok 3D grafikával kapcsolatos műveletet (amit PC-n a CPU csinál) átvehet 1-2 SPE, így a PPE-nek több ideje marad."
Gamelogic szinten is rengeteg dolog kapcsolódik a 3D környezethez. Ezek egy része biztosan gyorsítható az SPE-kkel, de nem olyan egyszerűen, és nem mind.
"Melyik játékban van ma "igazi" AI? Szerintem ma is eléggé behatároltak és előreprogramozottak, csak már kicsit összetettebb vezérlésűek."
Nagyságrendekkel összetettebbek. A valódi AI attól függ, hogy mit nevezel annak. A játékban szt szokás, ami nem szkriptelt, hanem programozott. Régen a stratégiai játékokban az AI nem épített, hanem megkapta a bázist, aztán a legyártott egységeket ellened küldte egyesével. Ma már az AI önállóan építi fel a bázist, optimális helyet keresve az épületeknek. Eldönti, hogy mit kell építeni, és milyen egységet gyáratni. Összeállítja a megfelelő csapatot, és azzal támad. Képes megkeresni a te bázisod gyenge pontját, és gonosz módon ott támad. De még a játékstílusodhoz is alkalmazkodik valamennyire.
"Nem értem, milyen plusz másolgatásra gondolsz."
Az SPE nem fér hozzá a PPE lokális memóriájához, így abban nem tud hatékonyan másolni.
"Ki beszél itt a PPE-ről és gamelogicról? Az SPE-k másolgatásban való részvételéről van szó."
Erre mondtam, hogy az ilyen másolgatásos feladatok egyébként sem a PPE-n futnak, így az SPE besegítése a PPE-nek itt nem játszik.
"Ha párszáz, vagy párezer quadwordről van szó, nem hiszem, hogy különösebb problémát jelent."
De itt max. 1 tucat byte-ról van szó egy lépésben, és az azon végzett művelet dönti el, hogy melyik adat kell legközelebb. GOndolj pl. nagy gráfban keresésre (arra sincs semmi garancia, hogy a szomszédok egymáshoz közel vannak a memóriában).
"És ugye közben a 2. threadben más feladat is futhat a PPE-n."
Hiába, mert itt az SPE idejével van a gond. -
dez #354 Azt is nézd meg, mihez képest: max. sávszél itt 2-300 GB/s.