47
  • dez
    #47
    Hát, ezek mind elég nyilvánvalók. De az a helyzet, hogy a 1-2 kivétellel az semmelyik játék és játékmotor nincs erre felkészítve, és kérdéses, mikor, és melyikeket fogják átírni. Egy játékon belül nem kiegyensúlyozott a teljesítmény-igény a független részfeladatok között [grafika, hang, fizika, stb.], így nem elég egyszerűen azokat párhuzamosan futtatni. (Bár biztos lesznek, akik beérik majd ennyivel.) Arra is gondolj, hogy kétféleképp kell megírni a kódot, single- és dual-core-ra is, mert még jó ideig ezek is párhuzamosan fognak futni.. :p
  • BiroAndras
    #46
    dez:
    Az, hogy milyen nehéz többszálú kódot írni, nagyon függ a feladattól. A legtöbb CPU igényes feladat jól párhuzamosítható. Emellett akkor is egyszerű a dolog, ha eleve több független feladatot kell egyidőben futtatni. Ez utóbbi egyre inkább jellemző az otthoni használatra.
  • mainruler
    #45
    Természetesen nem. :)
    Ne isteneítsünk termékeket. Használjuk őket. Arra valók.
  • dez
    #44
    Mondjuk ennél a 25%-nál azt is jó lenne tudni, mennyi idő 1db konvertálás. Mert lehet, hogy a kettő egyszerre jobban lassítja a P4-et kikapcsolt HT-vel, mint egy Athlont. És akkor nem sokat számít, hogy 25%, csak a saját gyengeségét kompenzálja.
  • dez
    #43
    Hát, nem tudom, hol nézted, nagyon rossz helyen, az biztos... :) "Értelmesből" régebbit hirtelen nem tudok, de itt van egy újabb. Egy esetet kivéve jobbal lassul a HT-s P4 a több feladattól, mint az Athlon (single és dual-magosak is). (Itt sajnos nincs olyan teszt, hogy mi lenne kikapcsolt HT-vel.)

    Ja, egyébként tényleg van nálad 25%-os gyorsulás (HT nélkülis esethez képest)? Szinte hihetetlen.
  • droland
    #42
    Azért azzal vitatkozom, hogy egy adott programnak KÖTELEZŐ támogatnia a dupla magot (vagy HT-t), mert nálam pl. ha egyszerre elindítok két mp3 tömörítést, mint a kettő egy 500 megás wav állomány egy ócska 3 éves programmal, akkor a HT bekapcsolása esetén 16 perc helyett 12 perc alatt lesz kész, ugyanis MAGA A WINDOWS XP oldja meg ebben az esetben a helyzetet, AMI AZT JELENTI, hogy ha maga a program is támogatná, akkor sokkal jobb lenne a helyzet.

    Más:

    Kikapcsolt HT-nél nálam pl. dvd írás, és mpeg4 konvertálás egyidőben szaggat a doom3, bekapcsolt HT-nél totál semmi sem érezhető...

    Tehát ha van is 15% lassulás valahol, az lehet, én hálistennek még nem találkoztam vele, de AMI AZ ÉRDEKES, az az, hogy én még nem láttam olyan tesztet, hogy HT-t ÚGY teszteltek volna, hogy több progit futtatnak egyidőben. Pl. 4 giga dvd film betömörítése rar-ba maximális hatékonysággal + mellette 3dmark 2005 futtatás. Sajnos ilyen jellegű tesztet, ami ezt hivatott tesztelni, azaz a HT lényegét még nem láttam, csak olyat, hogy:

    1/ HT bekapcsolva
    Winrar - x mp

    2/ HT kikapcsolva
    Winrar - y mp

    Már bocsánat, ez nem HT teszt, ez lóf***...
  • dez
    #41
    Mondok egy példát erre a megosztott/nem megosztott cache-re. A cache mérete ugyebár korlátozott, csak egy program-részlet (pl. nagyobb ciklus), vagy az adatok egy része fér bele. Nos, tegyük fel, két olyan program-részlet akar párhuzamosan futni, amikből egyszerre csak az egyik fér bele a cache-be. Két külön cache-nél nincs semmi gond. Osztott cache-nél mindkettőből kevesebb fog egyszerre elférni -> több hozzáférés a main ramhoz... (Vagy adott esetben L2-L3-hoz.)

    Továbbá, ha a két szál adott része egymás adataival is dolgozik, és önmagukban rövidek, jobb a megosztott cache, mert akkor könnyebben és gyorsabban hozzáférhetnek egymás adataihoz.

    Tehát, az adott program szempontjából egyátalán nem mindegy, hogy egyedi vagy megosztott a cache.

    A saját cache-sel rendelkező dual-core megoldás az első esetbe tartozik, a HT a másodikba... Így egy adott program-páros szempotjából az sem mindegy, hogy két core-on futnak, vagy egyen HT-vel.
  • dez
    #40
    Őőő, úgy érted, hogy akkor ne vegyünk semmit? Vagy vehetünk, de jól tapossuk meg? :)

    Egyébként szerintem pl. az Xbox procija, vagy a Cell elég jónak mondható.
  • dez
    #39
    "Hogy a cache osztott vagy sem, az a kód szempontjából répa."

    Ebben nem lenné annyira biztos, de vitatkozz rajta inkább Gabesttel.

    "A HT lényege épp az hogy 2 procinak láttatja magát, pont mintha 2 külön proci lenne benne. Az oprencer úgy is kezeli. Az más kérdés hogy mivel nincs 2 proci, nem mindig sikerül a párhuzamos végrehajtás, így a másik szál elég sokszor dekkol, mint az autók a piros lámpánál. Ha ződ lesz az út, majd megy tovább. Ugyanígy a 2. prg szál is."

    Köszi, de ezt eddig is tudtam... :)

    "Csak sebességbeli eltérés van a HT és a dupla mag között."

    Ebben sem lennék olyan biztos. Az "ellentmondásos" tesztek is arra vallanak, hogy ez nem ilyen egyszerű.
  • mainruler
    #38
    Nincs jobb. Épp ezt próbálom tudatosítani.
  • Robin Hood
    #37
    Hogy a cache osztott vagy sem, az a kód szempontjából répa. A vinyódon levő adatok se leszen másmilyenek, akár fat-ra, akár ntfs-re másolod.

    A HT lényege épp az hogy 2 procinak láttatja magát, pont mintha 2 külön proci lenne benne. Az oprencer úgy is kezeli. Az más kérdés hogy mivel nincs 2 proci, nem mindig sikerül a párhuzamos végrehajtás, így a másik szál elég sokszor dekkol, mint az autók a piros lámpánál. Ha ződ lesz az út, majd megy tovább. Ugyanígy a 2. prg szál is. Csak sebességbeli eltérés van a HT és a dupla mag között.
  • dez
    #36
    Persze, én nem mondtam, hogy a pl. dual-core rossz lenne.
  • dez
    #35
    Gabest azt akarta mondani (sikerült is, én egyet is értek vele), hogy más elrendezésű kód fut jól HT-vel, két procin/mag+nem_osztott_cache-en/mag+osztott_cache-en. Ezt a tesztek is mutatják. Van, ami HT-n egyenesen lassabb (annál, mint ha ki lenne kapcsolva :) ), két magoson meg gyorsabb. Van példa az ellenkezőjére is (Intelen :) )... Tehát, nem lenne könnyű teljesen kihasználni egy több magos HTT-s procit. Legalábbis, ami a mostani Pentium D-t illeti. (Van egy olyan érzésem, hogy az új Xbox-ban lévő proci kicsivel jobb konstrukció.)
  • Robin Hood
    #34
    Meg aztán a különböző háttérben futó servicek, viruskergetők, szoftveres tűzfalak se előled veszik el a prociidőt. Rengeteg előnye van még multithreades kód nélkül is.
  • Robin Hood
    #33
    Nem is arra való. De sztem elég sokan használják a gépüket intenzív multitaskban, arra megváltás lesz, nem kell homokórázni meg gyök2 sebességgel kirajzolódó ablakokat bámulni. Én várom nagyon, mert már most is ki tudnám használni. Természetesen nem hiszem azt hogy ettől dupla fps-sel fog futni a doom3, de hát van más cél is mint 1 db játék minél gyorsabb futtatása. Mondjuk 2 játék. :))
  • dez
    #32
    Az igaz, de ez nem segít, amikor épp proci-limites egy játék.. És ez főleg nem szolgáltat alapot a 4 magosoknak. Arra kíváncsi leszek, később mennyire és mennyien fognak több-szálú kódokat írni, mivel ez már kimondottan optimizáció témakör (már eleve egy algoritmus többszálúsítása, plusz az sem mindegy, hogyan), és azt sokan nem szeretik. (De előbb-utóbb persze kénytelenek lesznek...)
  • Robin Hood
    #31
    Nem kell, a többprocis gépekre se kell optimalizálni semmit. Ez is egy többprocis rendszer, csak összenyomva egy tokba.
  • dez
    #30
    De azért érdemes őket összehasonlítani, és a két rossz közül a jobbikat választani. (Vagy egy harmadikat. :) )
  • Robin Hood
    #29
    Egyrészt most kevés csak, majd lesz több is, másrészt ha több programot futtatsz egyszerre, máris van több szálad. Vagyis far cry alatt is tudsz videot tömöríteni (jogtisztát persze ;-)), és úgy fut mintha a másik progi nem is menne. (Legalábbis majdnem, memória sávszélességből, vinyóból nem lesz 2, de a procinak így is jóval többmindenre jut ideje.)
  • arty
    #28
    a HTT aztán nagyon sokat fog érni ám a p3 jellegű magban :) nem nagyon értem mit lehetne átvenni a p4ből, hacsak a "pentium" márkanevet nem .... :D rakás szutyok, ezt mostanra az intel is "beismerte" :)
  • mainruler
    #27
    Persze-persze. Én csak azt mondom, hogy fölösleges hőbörögni bármelyik cég marketingjén és termékein is, mivel mind a mi butításunkat hivatottak elmélyíteni. Ez igaz az AMD-re is. Meg minden másra is.
  • Gabest
    #26
    A különbség főleg a cache miatt van, két mag két külön cache-sel dolgozik, ami ahogy írtam lehet jó is és lehet rossz is. Erre is külön optimalizálni kell.
  • dez
    #25
    (Mellesleg az az 1, illetve 3 "PPC mag" sem egy régi PPC mag, hanem egy PPE, ami önmagában sem semmi.)
  • dez
    #24
    Rosszul tudod. Az Xbox 360-ban 3 magos proci van (ami összesen 6 szálat kezel).

    A Cell-ben csak egy PPC mag van, de az SPE-k sem csak buta SIMD egységek, hanem kvázi teljes értékű procimagok, saját DMA és MMU egységekkel, SIMD-re optimizálva.
  • dez
    #23
    Mostmár nem, de korábban sokan igen... :)
  • dez
    #22
    A tapasztalatok szerint legtöbbször nem hogy alig gyorsított valamit a HT (5%), sokszor inkább lassított (akár 15%-ot is)... :)
    Na persze ez az Inteles rossz megvalósításnak köszönhető, mert amúgy jó lenne.
  • dez
    #21
    Tudom. Arról van szó, hogy nagyon kevés a többszálú program, és sokszor nehéz ilyenre átírni valamit.
  • lmisi
    #20
    Az xbox-ban és ps3-ban dolgozó központi egység tudtommal csak 1 PPC magot tartalmaz a többi mag csak kiegészítő ill. vektorprocesszormagok. Valószinűleg túl drága és túl bonyolult lenne konzolba tööb PPC magos proci beépítése. Nem úgy mint IBM szerverekbe-workstationokba. Persze a felhasználási területük is más.
  • mainruler
    #19
    "Hozzátehette volna: "Az egész csak a vevők hülyítését szolgálta."

    Minden termék a vevők hülyítését szolgálja. Néhányat bekajálunk, néhányat nem. Ez most egy olyan, amit nem.
  • dikki*yysw
    #18
    Nem az a helyes kifejezés hogy hosszú pipeline-jű, de a P4 sokkal alkalmasabb volt a többszálú utasításvégrehajtásra. Alig 30-40% körül volt a végrehajtóegységek kihasználtsága, nagy késleltetés volt a buszon; ez egyáltalán nem jellemző a P-Mre, így sokat nem fog érni.

    Sztem sokkal inkább az ooo -ra gondoltak az "újítások" nál.
  • Robin Hood
    #17
    Nem az athlonokra, hanem a Pentium-M-re, ami a P3 továbbfejlesztése. De ezt már vagy 1 éve bejelentette az intel, csak eddig még erőltette a P4-et, mert nyilván minél több pénzt akart kaszálni váltás előtt (is).
  • Robin Hood
    #16
    Nincs ellenkezője. Duál magnál is ugyanúgy fogja futtatni mint ha 1 magos HT-s proci lenne, a különbség csak az hogy amennyiben mindkét szál ugyanazt az egységet igényelné, a HT-nál értelemszerűen várnia kell, dupla magnál meg talál magának egy másik ugyanilyet (már amennyiben egy 3. szál azt épp le nem foglalja).
  • Robin Hood
    #15
    Nincs külön kód HT-re meg dupla magra. Ha többszálú a programod, akár HT, akár dupla mag (vagy akár mindkettő), az automatikusan több szálon fog futni.
  • archkoven
    #14
    Mondhatta volna azt is, hogy az új processzor architektúrája az Atholonéra fog hasonlítani. Ennél a pentium3-as dumánál nagyon kilóg a lóláb.
    A konkurencia termékeit nyilvánosan a szánkra nem vesszük:)
  • Gabest
    #13
    Ahogy valaki okosan megfogalmazta (sajnos mar nem emléxem hol olvastam), a HT különböző, de egy helyen lévő, több mag meg hasonló, de máshol elhelyezkedő adatok párhuzamos feldolgozásához ideális. HT a több szálat az éppen kihasználatlan
    végrehajtóegységekre tudja szétosztani, viszont ha azok ugyanazt csinálják, akkor ez nehezen megy, de mivel egy proci egy cache-ből dolgozik, az a jó neki ha az adatok átfedik egymás vagy legalábbis közel vannak egymáshoz. Több fizikai processzornál meg épp ellenkezője az igaz, ha ugyanazon az adaton molyolnak, akkor egymás cache-ét teszik tönkre és sokat kell nekik szinkronizálni, viszont ugyanazt a fajta utasítást tisztán n-szer olyan gyorsan tudják lefuttatni.
  • dez
    #12
    Nem tudom, honnan veszed ezt, mindenesetre a most bemutatott XBOX 360-ban lévő 3 PPC magos prociban is van egy hasonló megoldás, így összesen 6 szálat tud futtatni. Na most, a PPC sosem a hosszú pipeline-ról volt híres.

    Már bemutatta, sőt azt hiszem, legalábbis OEM-eknek piacra is donta az Intel a dual-core-os prociját. (Nagyon sietett vele, csak összadobta, az Athlon X2 testhosszal előzi kisebb fogyasztással...)
  • dez
    #11
    A Windows csak annyit tud ebbe beleszólni egy-szálú alkalmazásoknál, hogy pl. párhuzamosan futtathaszt belőle többet is.
  • asysoft
    #10
    Tudtommal a HTT-hez hasonló technológiát csak nagyon hosszú pipeline-nal rendelkező CPU-ba lehet belerakni-P3 meg még szerencsére nem ilyen volt. Sztem el lehet felejteni a HTT-t, s hamarosan a DualCore-t kiáltja ki az Intel, mint utódot...
  • concrete
    #9
    "Magától nem fog... Úgy kell megírni."

    itt van a lényeg !!!!
  • nenad
    #8
    azert amennyire lehet (vagy annal egy kicsit kevesbe :)) windows megoldja a feladatot. Nem olyan nagy problema ez.Kesobb pedig vagy kulon egyseg oldja meg hardveresen, vagy tovabbfejlesztik a szoftvert.
    Egyebkent az hogy az intel vegul a rovidebb futoszalag fele veszi az iranyt az mutatja hogy a technologia amit kifejlesztettek hosszu tavon nem valtotta be a hozzafuzott remenyeket. Kivancsi vagyok a tovabbiakra.