Gyurkity Péter

nVidia: egyszerűbb Fermi chipek a játékokhoz

Az nVidia a találgatások megindulása és felélénkülése után elismerte, hogy új fejlesztése nem elsősorban játékokhoz és átlagos PC-khez készült, ennek butított változatai jönnek majd a felhasználóknak.

A cég az utóbbi napokban, pontosabban az első bemutatót követően, némi fáziskésésben erősítette meg azon külső találgatásokat, amelyek előbb a nagyközönség előtt ismertetett kártya belső tartalmát, majd pedig az új grafikus vezérlő szerepét, illetve a meghódítani kívánt szegmenst kérdőjelezték meg. Most arról beszéltek, hogy a Fermi inkább tudományos és egyéb profi célokra hasznosítható újdonságokat tartalmaz, ezek pedig nem sok előnyt jelentenek majd az egyszeri halandó számára.

A hivatalos bemutatókon előadást is tartó William Dally a cég részéről a Cnetnek nyilatkozva beszélt a Fermi (NV60, G300, GT300) újdonságairól, azok szerepéről, valamint az új chip elsődleges feladatáról. Megjegyezte, hogy a vezérlőt nem véletlenül jellemezték első alkalommal inkább szuperszámítógépekbe való fejlesztésként, hiszen több olyan újdonságot is tartalmaz, amelyet inkább profi felhasználására szántak, hiszen a mindennapokban nem sok előnyt nyújtanak az átlagfelhasználó számára. Ilyen a dupla pontosságú lebegőpontos számítás, ahol nagy teljesítménybeli előnyöket említettek, valamint az ECC-technológia, amely egyrészt drága, másrészt pedig szinte felesleges a fogyasztói alkalmazásra szánt fejlesztéseken.

A felhasználói PC-kbe, illetve a játékokhoz szánt változatok ehhez képest butábbak, egyszerűbbek lesznek, néhány ilyen technológiát nélkülöznek majd. Maga a Fermi 40 nanométeren készül, 512 (16*32) stream processzort és 3 milliárd tranzisztort tartalmaz, memóriainterfésze 384 bites, ezt pedig GDDR5 memória, valamint OpenGL 3.x, DirectX 11, illetve OpenCL 1.x támogatás egészíti ki. Az nVidia a maga részéről még nem beszél újabb változatok piacra dobásáról, ám az egyértelműnek tűnik, hogy ezen gondolkodnak, hiszen bevett stratégia a meglévő új fejlesztést lefelé skálázni, hogy a vékonyabb pénztárcájú felhasználók számára is megfelelő megoldást nyújtsanak - a változást itt az jelenti, hogy a zászlóshajó valószínűleg nem is lesz kapható a hagyományos PC-khez, avagy csak nagyon korlátozott mennyiségben.

Időközben a cég azzal váltott ki negatív visszhangot, hogy letiltotta a PhysX API alkalmazását a Radeon grafikus magot is tartalmazó konfigurációkon. Erre máris megszületett a válasz, egyes oldalakon ugyanis felbukkantak a házilag frissített szoftveres meghajtók, amelyekben ismételten engedélyezték a PhysX használatát, függetlenül a jelenlévő grafikus vezérlők típusától.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • Vers #16
    hát ja vannak problémák a simd architecturával , de nem kell szar kodot futtatni rajt, arra ott a proci

    a mimd architectura alatt olyan megoldást tartok megvalosithatonak ami nem az adatok párhuzamosságára épit , hanem a kodelemzésre
    pl adott egy 2D-s core tömb és a load/store/ifthenelse csak a tömb szélein van és pattogtatják a kodokat a tömbön el vissza , igy nem kell komplett processzorokat beépiteni elég csak egy szimpla végrehajtoegység
    nade ilyet megvalositva még nem láttam

    a többmagos cpu elméletileg mimd , de gyakorlatilag nem tarhato annak mert képtelenség megvalositani mainstreamben több száz magot tartalmazo chipet
  • kvp #15
    "2*16 utas a fermi, az elágazásnál jol bebaszna ha annyira lassulna,
    ugy megy ez hogy mindkét ágat végrehajtja a 16 -os simden és csak azok az értékek irodnak át ahol a feltétel igaz"

    Ez csak addig jo, amig csak egyszeres a melyseg. A legjobb ilyen conditional store rendszer amit lattam is csak 8-szoros melysegig mukodott, de ott mar 8-szoros lassulas is volt (64k alu-ra). Viszont for ciklusoknal ez a trukk mar nem jarhato, csak if/else eseten.

    "igazi MIMD architecturát még senki sem csinált"

    Az osszes tobbmagos cpu ilyen.
  • Vers #14
    2*16 utas a fermi, az elágazásnál jol bebaszna ha annyira lassulna,
    ugy megy ez hogy mindkét ágat végrehajtja a 16 -os simden és csak azok az értékek irodnak át ahol a feltétel igaz

    persze ez is lassit , csak igazi MIMD architecturát még senki sem csinált
  • kvp #13
    A 16*32-es architektura azt jelenti, hogy ha elagazas van a kodban akkor kartya 16-odara lassul. Az ati eseten ez eloszor 8-ada, majd mar csak 4-ede volt. Ezzel szemben az intel larrabee eseten ilyen lassulas nincs, cserebe kevesebb mag van benne alapbol. Ugy nez ki, hogy jelenleg a 32 magos cpu-k/gpu-k jelentik a gazdasagilag idealis szintet, a larrabee is ilyet hasznal, 128 bites simd-el, ami max. 16 alu-t jelent magonkent. Ez kb. ugyanaz amit az nvidia csinal, csak az intel fele x86-os utasitasokkal programozhato. Egyik sincs meg a piacon, bar az intel kihozta az egy es ketmagos gpu magjat cpu-nak, atom neven. Ebbol kapnank 32 darabot egy larrabee-ben. Mindharom ceg technologiaja ugyanarra alapul, csak az intel jobb forditoprogramokat tud irni es jobbak a gyarai.
  • kicsizoz #12
    Ha nem értesz egyet a cikkel, ott a forrásmegjelölés, elolvasod, és beírod, hogy mit értett félre a cikk írója!
    Nyugodt kulturált stílusban, és akkor mindenki meg fogja köszönni!
  • kicsizoz #11
    Próbálj már megnyugodni! :)
    Mióta bejelentette ATI az új kártyáját, neked rohamod van, a saját egészségedet teszed tönkre egy multi cég miatti rajongásod által, ráadásul ez a cég a bolygó másik oldalán tevékenykedik...
    Hidd el nem érdemes ennyire komolyan venni!

    Remélem nem bántottalak meg!
  • Rexhawk #10
    fordítottam
  • Rexhawk #9
    guglival fórdítottam:)
  • Sanyix #8
    A to-nak nem az avoid után kéne lennie?
  • Rexhawk #7
    Just to avoid falling into the hands of terrorists