• dez
    #25
    "ez nagyon messze áll a valóságtól."

    Gondolhatod, hogy nem én találtam ki, hanem tesztekből jött ki. Sajnos nem tettem el az oldalt, ahol pont ezt hasonlították össze, de keresem. 1-2x már belinkeltem. Az volt látható, hogy egy szál futtatása mellett egyforma teljesítményt adó P4-et és K8-at véve, 2 szál futtatása lellett kikapcsolt HT-val sokkal jobban lelassult a P4, mint a K8, utána bekapcsolt HT-val újra egálba kerültek.

    "Nézz utánna pontosan mit csinál a HT."

    Hát, attól tartok, ez most nem érdekel eléggé ahhoz. :)

    "Egyébként valóban gyorsabb a K8, azonban ha több szálat kezdessz futtatni, vagy olyan programot használsz ami direkt HT-re optimalizált, bizony messze lehagyja a K8-at a P4HT. (Pl. WMV enkóder)."

    Nonono. A fent említett tesztből nem ez jött le, legalábbis általános esetben. Az egy dolog, hogy kimondottan HT-ra optimizált kód gyorsabb lesz. Mint ahogy egyszálas esetben is gyorsabbak a kimondottan P4-re optimizált programok. (Ami néha azt jelenti, hogy akkor sem használja AMD-n a SSE2-t, 3-at, ha jelen van.)

    "Ja és nekem Athlon64-em van, mielőtt le Intelfanoznál."

    Nem szokásom.

    ""szted a processzor tervezők legóznak?" ha azt veszed alapul, hogy a 387-> MMX -> SSE -> SSE2 ma már ugyanaz az egység, akkor azt kell mondjam hogy igen."

    (Ezt nem én írtam, célszerű lenne külön válaszolni.)

    "Többek közt két ALU van, a CPU hoz képest 2x órajelen."

    Nem túl sokat ér a 2 ALU 1db INT, FPU, SSE, MMU, stb. egységgel.

    "az SPE egy programozható vektor CPU ami azonban igen ostoba."

    Az igaz, hogy egy általános procihoz képest jóval lassabban tudna futtatni egy általános kódot (mivel mindene megvan, ami ehhez kell, csak nem erre van kihegyezve), de tudna, tehát azért nem annyira ostoba. (A PPE-től teljesen függetlenül is tudnak programokat futtatni - mellesleg 1-1 saját nagyon gyors belső kis ramból is, de a main ramhoz is hozzáférnek.)

    "Amire én gondoltam az az, hogy a két HT szál simán el tudna futni 2 SSE egységgel (mivel teljesen más pipeline egységeket használnak) így nagyon jó teljesítményt lehetne velük elérni (a CPU egy-egy szála végezné el az SSEk vezérlését)."

    2 SSE nyilván jobb, mint 1, de egy önálló vektor-egység számítási szempontból sokkal hatékonyabb megoldás, mint általános célú magokat feltartani az SSE-zéssel.

    Mindenesetre úgy tűnik, az Intel is inkább a több, de "egyszálú" magra megy rá, egyelőre.

    Tényleg, össze lehetne hasonlítani, hogy 1db SPE hogy aránylik egy SSE-s P4 maghoz (számítási teljesítményben).

    "Nagyon valószínű hogy az Intel nem az én "brilliáns" ötletemet fogja alapul venni a jövőben, de szerintem rá lesznek kényszerítve valami hasonlóra."

    A távlati tervekben egy Cellhez hasonló felépítésű architektúra szerepel. Azaz az általános magok mellé ők is vektor-magokat terveznek majd. (Úgy 6-8 év múlva.)