2
  • kvp
    #2
    A TOPS a CPU-k eseten regen a muveleti sebesseget jelentette, tehat a vegrehajhato utasitasok szamat, fuggetlenul a tenyleges adatmennyisegtol. Tehat egy 1 bites bit clear is 1 utasitas volt es egy lebegopontos osztas is. Ez a szam igazabol a logikai pipeline-ok sebessegenek meresere idealis. (ha/akkor/egyebkent logika eseten)

    Egy GPU-nak van TFLOPS, TIOPS es TOPS meroszama is, de a parhuzamositasok altal okozott osszevonasok miatt ez nem linearis. Pl. a texturazo egysegek tobbnyire 2x2-es csempeket hasznalnak, ami 4 pixel alatti haromszogek eseten akar 25%-os gyakorlati teljesitmenyt is jelenthet.

    A TOPS most azert kerult be ujra a koztudatba, mert a legtobb neuralis halozat egesz szamos muveleteket hasznal, mert a modern neuralis halozatok a sebesseg miatt lebego pont helyett egeszekben (neha akar 4 bites egeszekben -3...+3 vagy 0..7 tartomannyal) taroljak a sulyokat, amik regen egy 64 vagy akar 128 bites lebegopontos adattipusban voltak. Ilyenkor az integer sebesseg szamit, amit tobbnyire TOPS-ban mertek a 70-es evek ota amikor az integralt integer ALU-k elterjedtek. (valojaban TIOPS es TLOPS lenne a helyes)
  • t_robert
    #1
    Amúgy a grafikai kártyák esetében ha közölnek nyers teljesítmény adatokat jellemzően a TFLOP értéket a 32 bites lebegő pontos számításra értik. Így az adatok alapján összevethető egymással a különféle kártyák legalább nyers számítási teljesítménye. Persze mive egy grafika valós teljesítmény vagy fél tucat paraméter függvénye a pontos képeségekről csak közelítő képet ad egy TFLOP érték. (memória sávszél, memória órajel, GPU órajel, végrehajtó egységek száma különféle verziókban. memória mérete, a memoria tipusa ) és hasonlóak kihatnak a tényleges teljesítményre. A TOPS mint mérőszám egyenlőre kiforratlan érték és nincsen rá egyértelmű gyakorlat, hogy mit kell alatta pontosan érten. Kiváncsiságból megpróbáltam megnézni, hogy pontosan mennyi lehet a RTX kártyám értéke TOPS-ban, nem sikerült. Találtam rá 50 körüli értéket de 100 felettit is. RTX kártya esetében leginkább az úgy nevezett TENSOR magok vesznek részt a dologban. Például nincsen TENSOR mag a GTX kártyákban és nincsen a radeonokban sem. Emiatt nehéz lehet összevetni egymással egy NVIDIA RTX kártyát más kártyákkal. De normális AI funkciókat mérő tesztprogramok se léteznek igazán.