• dez
    #503
    "Nem is azt mondtam, hogy teljesen ugyanaz, hanem hogy néhány tekintetben arra hasonlít."
    -- Amit írtál, azt azt jelenti, hogy nem HW SMT-s, de más szempontból egy 386 tudását hozza (csak magasabb órajelen). De még ez az új megfogalmazás sem igaz... Mi jön még, hogy úgy értetted, hogy van tokja és lábai? :)

    "Ez egyféle párhuzamosítás. Nyílvánvalóan nem erről beszéltem."
    -- Hanem miről? A superscalar felépítésből eredő végrehajtásról? De hiszen azt nem szabad tudnia. :)
    Félretéve a tréfát, igen, íráskor származhat hátrány az in-orderességből, főleg ha nem valamely cache-be megy az adat, hanem a main ramba. Mondjuk out-of-ordernél sem lehet abszolút minden ilyen esetet kizárni. Olvasásnál meg van mémi out-of-orderes beütés.
    De: inkább csak akkor, ha több írási művelet van egymás után! Ugyanis, van itt I/O buffer is ám. Tehát, egy pl. írási műveletnél nem kell addig várni egy más jellegű, vagy regiszteres művelet előtt, amíg nem ment ki az adat. Azért nem teljesen hülyék...

    "A branch prediction a futószalag hosszát kompenzálja, nem az out-of-order végrehajtást. Persze a kettő nem teljesen független."
    -- Én nem azt mondtam, hogy az out-of-ordert kompenzálja, hanem amiatt bonyolultabbá válik. Ha önmagában nem is (hw-függő), összességében az a logika, ami ezt is és mást is csinál, egymással összefüggésben.

    "A cell-ben sem 2-3 lépcsős a futószalag, így elkelne a jobb branch prediction."
    -- Jobb? Minél jobb? Nem tudod, milyen jó most.

    "Pontosabban te nem ismered ezek szerint a debugger és a fordító működését. És tapasztalatod sincs velük."
    -- Aha, csak kb. 15 éve használom őket. :DDD Bár a Windows-specifikus cuccokat (már ami x86-ra fordítást végez) nem ismerem, csak a GCC-t. Szerintem te itt valami egy bizonyos fordítóra/debuggerre jellemző furcsaságról beszélsz, vagy valami úgy technikára, amit én még nem ismerek.

    "Az optimalizáció nem merül ki abban, hogy a fordító a forrásból egy az egyben gépi kódot generál. Ennél sokkal többet tesz. Nincs időm ezt kifejteni, nézz utánna."
    -- Nem kell kifejteni, talán egy mondatból is megértem, mire gondolsz.

    "PC-n te nagyon lökött."
    -- Talán ha leírnád, mit is kellene kipróbálni, és melyik fordítóval/debuggerrel.

    "Igen, az X2-t néztem a sima A64 helyett. De akkor is a 230 millióban a 8 SPE is benne van. Az össz cache meg ugyanannyi a cell-ben is."
    -- De így azért már csak jobban fest a dolog... Főleg ha azt nézed, hogy az SPE-k sokkal kisebbek, mint a PPE.