Berta Sándor

A szuperszámítógépek is hibáznak

Az elmúlt években világszerte egyre több nagy teljesítményű számítógépet helyeztek üzembe. A teljesítmény növelése mellett fontossá vált az is, hogy ezek a rendszerek megbízhatóbbak legyenek.

Számos tudós és mérnök foglalkozik világszerte azzal, hogy megbízhatóvá tegye a szuperszámítógépeket. Mindez közel sem egyszerű feladat, hiszen több ezer processzor, memória és más alkatrészek működését kell összehangolni és optimalizálni. Teljesen normális dolog, hogy időnként ezek a rendszerek meghibásodnak, elromlik az egyik alkatrészük. A cél a két meghibásodás közötti idő meghosszabbítása.

Az Amerikai Egyesült Államok Lawrence Livermore Nemzeti Laboratóriumában működő Accelerated Strategic Computing Initiative (ASCI) szuperszámítógép működésében már 2001-ben átlagosan minden ötödik órában hibát jegyeztek fel. A különböző optimalizálásoknak és az új technológiák használatának köszönhetően sikerült ezt az időt 55 órára kitolni. Azóta azonban a szuperszámítógépek még nagyobb teljesítményűek lettek és ez a folyamat a jövőben sem fog megváltozni. A napjainkban elérhető hibajavító technológiák néhány év múlva már nem lesznek elegendőek, ezért a szakemberek komoly kihívás előtt állnak.

A szakértők számos megoldáson dolgoznak. Ana Gainaru, az Illinois Egyetem munkatársa most egy olyan technológiát mutatott be, amely a naplóadatok elemzése alapján lehetővé teszi a jövőbeli hibák felbukkanásának előrejelzését és ellenintézkedések bevezetését. Az első eredmények biztatóak, a rendszernek az esetek több mint 70 százalékában több mint 10 másodperc ideje marad az összeomlás vagy fagyás előtt az addigi eredmények eltárolására. Később a munka a legutóbbi mentéstől folytatható.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • Szefmester #5
    Aztán az emberek miután felkapták a fejüket elkezdik (joggal) szidni a készítőjét, majd az értékelésnél megadják a neki járó pontszámot. ;)
  • KopaszIsten #4
    Azért ez lett a címe, mert erre jobban felkapják az emberek a fejüket, és többen kattintanak. (think)
  • kvp #3
    Erdekes, de a google mintha mar megoldotta volna a problemat. Sokkal tobb gepuk van, sokkal nagyobb teljesitmennyel, csak nem tudomanyos celra hasznaljak. Es mindezek mellett kepesek kezelni a meghibasodasokat fennakadasok nelkul. Igaz ugyan, hogy van amikor honapokig ul egy hibas gep a tobbi kozott mire megjavitjak, de ez nem zavarja a rendszert. A cikkben emlitett tudosok csak ujabb cikket akarnak irni a statisztikakrol.
  • gabpapa #2
    Hát igen az összeomlás, ill. fagyás nem apró hibácska:-).
  • Szefmester #1
    Miért érzem azt hogy a cím sokkal reálisabb lett volna ha "A szuperszámítógépek is elromlanak"-ot adják a cikknek?

    A hibázás kifejezés inkább arra utal hogy elvétenek egy egy számítást vagy utasítást, nem pedig arra hogy az egyik prociban leáll az egyik mag.