Mortimer

AMD Athlon (Thunderbird) 800



Inog az Intel fején a korona, vagy már le is esett - az AMD ölébe. A Thunderbird kibocsátásával ugyanis az AMD tökéletesítette a korábbi Athlonok egyik legnagyobb hibáját, az L2 cache-t, és ezzel megalkotta korunk egyik legjobb, asztali gépekbe szánt processzorát.

Nem is olyan régen még a lehető legnagyobb másodszintű gyorsítótárral rendelkező Socket 7 alaplapokat kerestük, de mára már L2 cache véglegesen átköltözött az alaplapról a processzorba. Sikeresen túljutottunk azon az időszakon is, amikor a memória chipek a processzor kártyáján helyezkedtek el. Először az alacsony árfekvésű Intel Celeronok jelentek meg integrált on-die (processzorral azonos lapkán elhelyezkedő) cache-sel, utánuk az Intel Pentium III-mak, majd legvégül az AMD Athlon-ok is csatlakoztak hozzájuk.

A gyártók szerkezeti és gazdasági megfontolások miatt kezdték az L2 cache-t beleépíteni a processzor magba. Gazdaságosság szempontjából egyértelmű a dolog: mivel nincsenek SRAM chipek, a processzort kártya és tok nélkül lehet gyártani. Emiatt a processzor összeszerelés egyszerűbb és olcsóbb lesz, mivel a gyártó függetlenné válik a nyáklapot, SRAM-ot és CPU tokot szállító kívülálló harmadik féltől. Más szóval a gyártó nem csak pénzt spórol az alkatrészeken, hanem fel is gyorsítja a processzor összeszerelését.

A processzor architektúra szempontjából a legelső szembetűnő előny az, hogy ugyanaz az órajel használható az L2 cache-nél mint a CPU magnál, mivel mindkettő ugyanazon a lapkán helyezkedik el. Másképp megfogalmazva, az L2 cache a processzor teljes órajelén működhet. Mint ismeretes, amikor a cache a processzoron kívül helyezkedett el, lehetetlen volt elérni a processzor órajelét. Például az Athlon 700 MHz-es modell esetében a maximum elérhető L2 cache órajel 350 MHz volt, mivel a cache ekkor a CPU órajelének felével működött. Később, minél feljebb ment a processzor órajele, annál rosszabbá vált az L2 cache helyzete. Az AMD beszállítói nem tudtak megfelelő, a processzor órajelének 2/5-én működő cache memóriát biztosítani. A 900 MHz-es modellektől kezdve a cache memóriáknak már csak a CPU órajelének 1/3-án kellett működniük, amit a szorzó csökkenésének ellenére az eddigieknél is nehezebben értek el. Ennek eredményeképpen az L2 cache lett a CPU teljesítményének növelésének legnagyobb hátráltatója.


Továbbá elméletileg sokkal hatékonyabb busz használható a CPU mag és az L2 cache között, ha az ugyanazon a lapkán található. Sokkal kevesebb idő és erőfeszítés szükséges ahhoz, hogy összekössünk két egymáshoz közel elhelyezkedő dolgot, minthogy kidolgozzunk egy sor bonyolult módszert a jelek szinkronizácójára és megtervezzük a nyák elrendezését a külső SRAM chipekhez. A legjobb példa erre a Coppermine magos Intel Pentium III, mivel az L2 cache processzorba való integrálásával lehetőségük nyílt a processzor mag és a cache közötti busz szélességének megnégyszerezésére (64 bitről 256 bitre). Ezek után felmerül az a nagyon logikus kérdés, hogy ha az on-die L2 cache ennyire jó és hasznos dolog, miért ragaszkodtak eddig ennyi ideig a külső L2 cache-hoz? A válasz egyszerű, csak számba kell venni az L2 cache hátrányait. Mert mit is jelent az on-die cache memória? Plusz tranzisztorokat, amik a processzor magját megnövelik, és a nagyobb magot sokkal nehezebb elkészíteni. Továbbá minél nagyobb a mag, annál nagyobb a leadott hő és ebből fakadóan az igényelt hűtés nagysága. Ez az a pont ahol egy másik tényező is belép: a gyártási technológia. Korábban a 0.25 mikronos technológiával nagyon nehéz volt az L2 cache-t integrálni a processzor magba, az előbb említett okok miatt (eltekintve a Celeron-tól és a Mendocino-tól, ahol a cache mérete olyan kicsi volt, hogy gond nélkül be lehetett helyezni a processzormagba). A fejlesztők álma akkor vált valóra, amikor a gyártók átálltak a 0.18 mikronos technológiára. Akár 256 KB L2 cache is könnyedén befért a magba, ezért a gyártók sokkal több és jobb termékeket tudtak bejelenteni, mint ahogy azt korábban tervezték.

Mérlegelve az on-die L2 cache előnyeit és hátrányait, mindenki valószínűleg arra következtetésre jut, hogy a processzor magba integrált L2 cache sokat ígérő dolog. Erre a következtetésre jutott az AMD is, főképp mivel az AMD mindkét gyára (a drezdai és az austini is) sikeresen átállt a 0.18 mikronos technológiára (a régebbi Athlon-okat is már ezzel a technológiával gyártották).

Innét ered az új-régi Athlon, a Thunderbird. Új-régi mivel egyetlen dologban különbözik az új processzor struktúrája a régi Athlon-étól, ez pedig a processzor magjába integrált 256 KB L2 cache az eddig használt 512 KB-os külső L2 cache helyett.

A Thunderbird adatai:

  • 0.18 mikronos technológiával gyártott réz vagy alumínium alapú chip
  • Athlon architektúrán alapuló Thunderbird mag, 37 millió tranzisztorból, 120 mm2-es méret
  • 462 lábú Socket A alaplap szükséges hozzá (Slot A verzió csak korlátozott számban kapható OEM célokra)
  • Nagy teljesítményű 100 MHz DDR EV6 rendszer busz
  • 128 KB L1 cache (64-64 KB adat, illetve utasítás cache)
  • 256 KB on-die L2 cache, a processzor órajelével azonos sebességen futva
  • 1.7V 850 MHz-en, 1.75V magasabb órajelen
  • 3DNow! SIMD utasítás csomag
  • 750, 800, 850, 900, 950, 1000 és 1100 MHz-es változatokban kapható Amint mondtuk, az egyetlen szerkezeti különbség az Thunderbird és az Athlon között a 256 KB integrált on-die cache. Bár a cache mérete csupán az eddigi fele, a teljesítmény mégsem csökkent, mivel az új cache sokkal gyorsabb lett mint a régi (a processzorral megegyező órajelen fut); és mivel a Thunderbird cache-se sokkal közelebb helyezkedik el a processzor maghoz 45 százalékkal alacsonyabb lett a késési ideje (latency), mint a régi külső L2 cache-nek.

    A második különbség a régi és az új Athlon között a megjelenés. Mivel a Thunderbird-nek nincs szüksége processzor kártyára, ezért Socket A (462 lábú) foglalatú a Slot A tokozás helyett.

    A Thunderbird-et az AMD két gyárban gyártja: Austinban és Drezdában, két különböző technológiával: alumíniumból és rézből. Úgy tűnik, hogy a leglényegesebb különbség a két változat között a színük. A drezdai gyárban készülők kékek, míg az austiniak zöldek. Eddig a Thunderbird-ről csak jó hangzott el, tehát most következzen a kritika.

    A Coppermine és Thunderbird L2 cache-ének összehasonlítása

    A Thunderbird egyetlen előnye a Coppermine-nal szemben a cache kizárólagossága. Ez azt jelenti, hogy az L2 cache algoritmusa szerint ha egy adat el van tárolva az L1 cache-ban, akkor az nem található meg az L2 tárban. Ebből következik, hogy a Thunderbird teljes cache mérete 128+256 KB = 384 KB. A Coppermine esetében az L2 cache-ből 32 KB mindig az L1 cache másolatát tartalmazza, ezért a tényleges cache mérete csak 256 KB. Ami a probléma, hogy a Thunderbird L2 cache-e ezzel együtt is lassabb, mint a Coppermine L2 cache-e.

    Felmerül a kérdés, hogy miért? Először is a Pentium III cache várakozási ideje sokkal kisebb, másodszor pedig az AMD mérnökei nem változtatták a mag és az L2 cache közötti busz szélességét (így az maradt 64 bit), míg a Coppermine-é négyszer szélesebb (256 bit). A másik érezhető probléma az Thunderbird-ökhöz való alaplapokkal van. A VIA Apollo KT133-on alapuló Socket A alaplapok még csak most kezdenek kijönni és még mindig nehéz hozzájuk jutni.

    Az AMD állítása szerint a Slot A foglalatú Thunderbirdek nem működnek együtt a VIA Apollo KX133 chipsettel. Ezt tisztázandó, leteszteltük néhány alaplapot, hogy megtudjuk hogy vajon kompatibilisek-e az AMD Athlon 700 alapú Thunderbirddel. Furcsa, de majdnem az összes általunk tesztelt alaplap probléma nélkül működött a processzorral.

    A tesztelt alaplapok listája: ABIT KA7 (VIA KX133), ASUS K7M (AMD 750), ASUS K7V (VIA KX133), Gigabyte GA-7VX (VIA KX133), MSI MS-6195 (AMD 750), SOYO SY-K7AIA (AMD 750), Tyan S2380 (VIA KX133)

    Csak két alaplap nem bootolt be a Thunderbird 700-zal, az EPoX EP-7KXA (VIA KX133) és a SOYO SY-K7VIA (VIA KX133)

    A hat tesztelt VIA KX133 chipsetű alaplap közül négy tökéletesen működött az új Athlon processzorral, az AMD állításának ellenére. Térjünk át a tesztekre. A felhasznált konfiguráció a következő volt:

  • "Régi" és "új" AMD Athlon 800 processzor, Intel Pentium III 800EB processzor
  • Chaintech 6ATA4,. ASUS K7V és Gigabyte 72M alaplapok
  • 128 MB PC133 SDRAM (Micron)
  • Creative 3DBlaster Annihilator Pro vga kártya
  • IBM DJNA-372200 HDD
  • Creative SoundBlaster Live! hangkártya Amint látható a tesztek majdnem megegyező konfigurációkon futottak, amik csak a különböző VIA chipsetre épülő alaplapokban különböztek (a chipsetek a következők: Apollo Pro133A, KX133, KT133). Ez segít minket abban, hogy chipsetektől függetlenül ítélhessük meg a processzorokat. Először jöjjenek a mesterséges tesztek, majd a valós alkalmazások:


    Ez a teszt a CPU integer egységének teljesítményét és az adatfeldolgozó sebességét mutatja meg. A gyorsabb L2 cache-ének köszönhetően a Thunderbird 3%-kal gyorsabb, mint a Pentium III. Az eredmények azt is mutatják, hogy a megnövelt L2 cache órajel pozitív hatással van a teljesítményre még akkor is, ha a cache fele méretűre csökken.

    Ez a teszt az aritmetikai segédprocesszor "igazi" teljesítményét méri, mivel az összes szükséges adat elfér a CPU L1 cache-ben. Az eredmények alapján a Thunderbird és a régi Athlon ugyanazt a CPU magot tartalmazza - azonos órajelen azonos eredményt értek el.


    A 3Dmark2000 teszt a CPU sebességét méri tipikus, SSE és 3DMNow! SIMD utasításokat igen aktívan használó 3D játékkörnyezetben. Ahogy azt láthatjuk, az Intel Pentium III minden kétséget kizáróan első, amit valószínűleg a fejlettebb L2 cache-nak köszönheti inkább, mint a SIMD utasítások jobb implementációjának.


    És most térjünk át a valós életből vett alkalmazásokra. A Content Creation Winstone 2000 szerint az AMD CPU-k kicsit gyorsabbak Intel riválisuknál. Az új Athlon viszont csak 5%-kal gyorsabb a réginél.


    Ez a teszt szintén irodai alkalmazásokon keresztül méri a CPU teljesítményét. De a SYSmark 2000 olyan applikációkat tartalmaz, amelyekben az Intel processzorok mindig jobbak voltak mint az AMD processzorok. Ennek két fő oka van: elsőként az SSE támogatás jobban implementált az Intel processzorokban, másodszor pedig az Intel CPU-k sokkal hatékonyabban dolgoznak az L2 cache-vel. De mára ez a helyzet végleg megváltozott: az új Athlon átvette a vezetést megelőzve 3 ponttal az Intel Pentium III-at azonos órajelen futva.

    Most lássuk a Thunderbird játékokban nyújtott teljesítményét. Ahogy azt már többször is mondtuk, Quake 3-ban magasabb felbontásoknál a képfrissítés gyakorisága (FPS) az egyes eszközöket összekötő busz sávszélességén múlik. Mivel az Athlon rendszerekben használt EV6 processzor busz több adat szállítását teszi lehetővé a CPU és más részek között, az AMD processzorok némileg magasabb eredményeket érnek el, mint az Intel Pentium III.


    Quake 3 alacsony felbontásban a teljesítmény sok dologtól függ, ezért mutatja ez a teszt szépen az átlagos teljesítményt. Jelen esetben az összes résztvevő nagyon hasonló eredményeket produkált, mindenek mellett a Thinderbird egy kicsit gyorsabb lett.


    A különbség minimális. A Thunderbird mindössze 1%-kal lett gyorsabb, mint a Pentium III, és csak 2%-kal gyorsabb, mint a régi Athlon.


    A helyzet hasonló az előzőhöz.


    Az Expandable nagy adat blokkokkal dolgozó játék. Ezért jön jól az AMD CPU-kban használt EV6 busz sávszélessége. És természetesen a Thunderbird gyorsabb L2 cache-e, ami segíti, hogy átvegye a vezetést a régi Athlontól.


    A helyzet tökéletesen ugyanaz, bár most az új Athlon sebessége 2-3%-kal nagyobb, mint a régié. Szerencsétlenségünkre nem tudjuk felmérni az új Athlonok túlhajthatóságát. A probléma az, hogy az EV6 busz nem engedi meg az FSB frekvenciájának túl nagy növelését. A legkisebb órajel növelés is instabilitást okoz az egész rendszerben. Példának okáért mi nem tudtuk túllépni a 105 MHz-s határt.

    Azokról az alaplapokról szóló hírekre, amelyek megengedik majd a szorzó változtatását, sajnos az AMD közlése szerint a processzorokban ez a funkció le lesz tiltva.

    Összefoglalás

    Sajnos ki kell jelentenünk, hogy a Thunderbird semmi újdonságot nem hozott sem a processzor architektúrájában, sem teljesítményében, csak logikus folytatása az Athlon családnak.
    A Thunderbird-öknek semmilyen újítást nem találunk. Az AMD mérnökök egyszerűen megváltoztatták a méretét, helyét, és órajelét az L2 cache-nek. Ez az oka annak, hogy csak elhanyagolható teljesítménynövekedést tapasztaltunk a régi Athlonhoz képest. Ahogy már mondtuk a processzor architektúra változatlan maradt, az L2 busz szélessége sem változott, ami meglátszik a teljesítményen és megakadályozza, hogy az L2 cache a legjobb formáját hozza.

    Az AMD nem kívánja a jövőben sem változtatni a busz sávszélességet a Mustang kibocsátásáig, ami a tervek szerint nagy méretű on-die L2 cache-sel fog rendelkezni. Az egyetlen dolog, ami az Athlon rendszereknek segíthet a jobb szereplésben, az a DDR SDRAM használata, ami már nem is tűnik olyan távolinak. Az első DDR SDRAM-ot támogató Athlon chipset, az AMD 760 várhatóan az ősszel jelenik meg. Eközben az Athlon - Pentium III verseny továbbá is lezáratlan maradt.
  • Hozzászólások

    A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
    Bejelentkezéshez klikk ide
    (Regisztráció a fórum nyitóoldalán)