Gyurkity Péter

48 magos processzorokkal jelentkezik az Intel

Az Intel jelezte, hogy hamarosan kísérleti fejlesztéseket mutat be, amelyek 48 mag együttes erejére támaszkodnak majd. Az első példányokat kutatóknak szánják, ám egyes technológiák utat találnak majd az asztali masinákba is.

A PCWorld számolt be elsőként a processzorgyártó terveiről, mégpedig annak munkatársára hivatkozva. Ebből megtudhatjuk, hogy a 48 magos processzorok elsősorban kutatók és egyéb szakemberek számára készülnek, alkalmazási területük pedig leszűkül majd a különböző intézetekre és egyetemekre, ahol nyilván válogatott személyzet veheti majd kézbe azokat.

A hamarosan, a második negyedév végén megjelenő x86 chipek elismerésre méltó mutatókkal érkeznek. Ugyan csak korlátozott számban lesznek elérhetők (azok is csak a fent említett intézetek számára), minden egyes mag 1,66 és 1,88 GHz-es órajelen fut majd (ahogy azt többnyire az Atom processzorok esetében is megszokhattuk), akár mindegyik mag külön operációs rendszert és egyéb szoftvert futtathat saját másodszintű gyorsítótárral, emellett pedig minden egyes processzor négy integrált DDR3 memóriavezérlőt is magába foglal.

Ami a fogyasztást illeti, az igazi meglepetést talán itt találjuk. Dacára ugyanis a magok nagy számának, valamint a tűrhető órajelnek, a processzor teljes fogyasztása 25 és 125 watt között mozog majd, nyilván attól függően, hogy éppen mennyire használjuk ki erejét. Természetesen az egyes magokat dinamikus módon le is tilthatjuk a kisebb étvágy érdekében (ahogy azt már szintén megszokhattuk az újabb többmagos processzoroknál), emellett pedig az órajel állandó módosítása sem jelent majd problémát, akár szoftveresen vezérelve sem.

A tavaly single-chip cloud computer (SCC) néven ismertetett chip a jövőben alkalmazandó új architektúra kezelésére hivatott felkészíteni a kutatókat, ám egyes technológiái akár a mainstream asztali és mobil processzorokban is felbukkanhatnak, miközben az Intel akár százmagos, vagy még bonyolultabb nagytestvéreken dolgozik majd.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • Oláh Herkules #48
    blender...
  • kvp #47
    Eleg nagy a kavarodas, de a helyzet a kovetkezo: Vannak a mai gpu-k amikben van X darab altalanos cpu mag. Ezek a magok tartalmaznak simd utasitasokat, amiket a felhasznalva egy utasitasban tobb muvelet vegezheto el. Az altalanos megoldasok 8-16 parhuzamos muveletet engednek meg egy fizikai utasitasban. Igy a gpu keszitok beszoroztak a magok szamat a simd utasitasok parhuzamossagaval. Ezeket hivjak szalaknak, vagy szal csoportoknak. A vliw rendszer egy egyszerusitett megoldas, ha valaki nem akar valodi szuperskalar cpu-t kesziteni. Egy mai intel proci tartalmaz atlag 5 pipeline-t, amik egymastol fuggetlenek, egy kulon in-order koherencia egyseggel megtamogatva. A gpu-k ezt ugy oldottak meg, hogy egy pipeline van, igy a koherenciat a fordito biztositja elore. Ez kb. 50%-al gyengebb mint a dinamikus futasideju optimalizacio, de nem igenyel kulon aramkoroket. A gpu keszitok kulon celhardverkent szoktak feltuntetni a load/store egysegeket is, pedig ez minden cpu-ban alap. A texture unit-ok is csak specialis load egysegek, mig a rop unit-ok specialis store egysegek. Erre a celra x86-os csaladban kombinalt egysegek szolgalnak, tehat minden load/store unit kepes irni es olvasni is. A lokalis rambol ket fajta van. A thread group local (vagy L1) az amit az intel regisztereknek hiv. A masik pedig a kartya teljes dinamikus ram-ja, amit a load/store egysegek cache-elhetnek ha akarnak (L2/L3). A valodi gpu magok szamat mindig a branch egysegek szama adja meg, a tobbi csak simd utasitasokbol van osszerakva.

    Tehat egy mai core2 quad processzor gpu terminlologiaval elve egy 64 magos videokartyanak felel meg, csak a szuperskalar felepites miatt a gpu-khoz kepest azonos orajelen ketszeres teljesitmennyel. (azaz egy 2Ghz-es core2-es egy 4Ghz-es gpu-val merheto ossze mips-ben)

    Az intel 48 magos rendszere pedig egy 768 magos gpu-nak felel meg, de a PI-es mikroarchitektura miatt itt nem ervenyes a ketszeres orjel szoro, tehat ezek orajelben mar 1:1-ben hasonlithatoak ossze a mai gpu-kkal. Fontos teljesitmenyveszteseg az is, hogy a textura szures szoftveres (mint a gf8800-asoknal volt), tehat egy filtered texture load akar 4 utasitas idejet is megeszi, ami a shader kodtol fuggoen lassitja a feldolgozast.

    "A (1 PPE & 7 SPEs) inkább egy többmagos x86-ra hasonlít mint akármelyik gpu-ra. Abban egyetértek hogy az összehasonlítást óvatosan kell kezelni."

    A cell-ekben van 1 darab 64 bites powerpc proci, ez egy modern risc ami jo. A 7 spe (8 volt, de a ps3-asok csak a selejteseket kaptak, amiben meg 2 hibas volt ment a bravia tv-kbe), amibol 6 volt hasznalhato (1-en ment a masolasvedelem) csak sima dsp volt. Egy viszonylag kis lokalis memoriaval felszerelt, nagyon gyors, de nagyon buta dsp. A fejlesztest pedig az fogta meg, hogy az spe-k nem lattak a teljes memoriat. Tehat mig egy gpu latja a kartya teljes sajat ram-jat, addig a cell spe-k dma-val keregethettek el a rendszerrambol az adatokat. Az az algoritmus aminek a dataset-je koddal es stack-el egyutt nem fer el 128 KB-on, csak modositva volt futtathato spe-n. Marpedig csak ezert az egy dsp-jert nem fogja senki atirni a kodjat, ami az osszes tobbi architekturan jol fut. Nem eri meg penzugyileg. Nem veletlen, hogy az ibm dobta a cell-ek fejleszteset. A sajat tervezoje is elismerte, hogy a crossbar memoriavezerlo kihagyasa sporolas miatt hiba volt, a kis lokalis ram pedig betett a programozok lelkesedesenek. Ki akar ugy fejleszteni, hogy a nagy szamitasi kapacitas egy merevlemez csatolonak is epphogy elegseges csatorna vegen van, es csak par KB ram van a procikkal egy oldalon? Ugy nez ki, hogy az ibm is megunta.

    ps:
    Miert nem arulja ezeket a sokmagos chipeket az intel? Mert teljesitmenyben eppen csak ott vannak mint a konkurensek, de az altalanos memoriakezeles es vedelem miatt ketszer annyi tranzisztor kellett ezekhez a chip-ekhez, tehat valami katasztrofalis a kihozataluk. Viszont 1-2 magos formaban atom-oknak hivjuk oket (16-32 magos gpu-k lennenek ha nem cpu-nak hasznalnak oket). Ha viszont elkezdenek arulni az eredetileg 48, de csak 12/24/36 mukodo magos hibas chipeket, mint low end cpu/gpu kombokat...
  • philcsy #46
    Az hogy az x86-on nevelkedett programozók nem tudtak mit kezdeni a Cell-procikkal, inkább a programozók "érdeme", mint az architektúra hibája, aki megtanult rá programot annak nem okozott problémát.

    A (1 PPE & 7 SPEs) inkább egy többmagos x86-ra hasonlít mint akármelyik gpu-ra. Abban egyetértek hogy az összehasonlítást óvatosan kell kezelni.

    Ami tény az elérhető teljesítmény / felhasznált energia arányban idáig a legjobb általános célra használható processzor. Lehet hogy a GPU-k nyers teljesítmény / felhasznált energia arányba verik de ott az elérhető teljesítmény általában a nyers teljesítmény alig tizede, kivéve a speciális feladatokat (a Fermiről meg majd idővel nyilatkozzunk).
  • RealPhoenixx #45
    Egyesek total megfeledkeznek errol:
    http://www.sg.hu/cikkek/33541/asztali_szuperszamitogepeket_iger_a_nemreg_megalapitott_orion

    Es errol:
    http://www.hwsw.hu/hirek/30775/bezarja-kapuit-a-96-processzoros-munkaallomasarol-ismert-orion.html

    Nyhe koppintas az egesz, a hatterben pedig az Orion ceg fejlesztesei vannak, amely ceg mara mar megszunt, nem veletlenul *valakiknek a keze rendesen ott volt*.
    Erdekesseg keppen csak a kovetkezot sugallom: 48*2=96
  • pasi29uk #44
    Linuxon 3D-re melyik programot ajánljátok?
    Objektum tervezésre, renderre valamint kisebb animációk készítésére gondoltam. Konfig egy Quad proci 4GB Rammal és egy nagyon profi videokarival támogatva a konfigom.
  • pixx #43
    Úgy írd inkább, hogy boxon, meg vannak a paraméterek, mikor készítesz egy játékot, ha valami túl nagy, vagy kevés a gépnek, a szoftver jelzi azt. PS3-nál ha valami nagy vagy kicsi, csak akkor tudod, meg ha játszol vele, mert mindent ki kell hozzá számolni.
    Milyen jó lehet, úgy programozni, hogy pluszba még egy szoftver munkáját is el kell végezni...
  • pixx #42
    Nekem van mindkettő grafban szerintem x jobb, ezt a Mirror's Edge alapján mondom...boxra megvettem, ps3-hoz adták...
    Heavy Rainben az arcok nagyon jók, de pl. a háttér az nagyon rossz, rengeteg szögletes tárgy van(aminek kereknek kéne lennie), mint anno ps2-n.
    God of War 3 nem rossz játék, de nem az csúcs grafika, amit vártam. Talán 2-3 év múlva már elő tudják hozni belőle a szörnyet, de addigra késő lesz már valószínűleg...hülyeség volt a cell-t belerakni, mert inkább visszavetett a ps3-ra való fejlesztésben...

  • Szemjuel #41
    nem nyers erőből verik meg a pc-t hanem az optimalizálásban! nyilván sokkal egyszerűbb egy szabvány gépre célprogramot írni, mint úgy megtenni, hogy állítgathasson minden faszságot a kedves user, meg ezerféle konfiguráción fusson ugyan úgy...
    ne hajtsad a butaságot plz

    @philcsy
    a cell processzor miért is volt csúcs? gyakorlatilag a programozók rémálma! de leegyszerűsítem: ha van egy 600 lóerős autód aminek olyan rossz a tapadása hogy nem tudsz elindulni vele normálisan, de ha elindulsz is csúszkálsz az úton. csúcsnak neveznéd? nem!
  • Bendegoose #40
    hali,

    tudna nekem abban vlki segíteni, hogy abit kn8/kn8 ultra -ba be tudok rakni, egy nvidia gts 250-et?
    az nvidia oldala írja, hogy ez a kártya pci-e 2.0-ás, csak az abit oldalán nem találom, hogy milyen típusú a pci-e foglalata.
    ha netalántán nem 2.0-ás a foglalat, attól még bele lehet rakni, fog működni?

    plz,
    hlp,
    thx,
    b.
  • Oláh Herkules #39
    arról nem is beszélve hogy az amd prociknál, csak opteronnál volt nem 2xX magos, asztaliak mindig natívan x magosak, tehát már jó rég van 4 magos nem csak 2x2.