SG.hu

A játék PC-k segíthetnek az MI modellek képzésében

Több startup célozta meg a játékkonzolokban vagy irodai gépekben milliószámra jelenlévő kihasználatlan GPU-chipeket, hogy virtuális „elosztott” hálózatokat varrjanak össze, hogy így versenyezzenek az MI adatközpontokkal.

A legjobb mesterségesintelligencia-rendszerek létrehozásáért folyó éles versenyben a legértékesebb erőforrás nem az adatok, a kutatók vagy a pénz, hanem egy drága chip, az úgynevezett grafikus feldolgozó egység. Olyan cégvezérek, mint Elon Musk, Mark Zuckerberg és Sam Altman úgy vélik, hogy a mesterséges intelligencia terén a dominancia és a vereség közötti különbség a lehető legtöbb GPU felhalmozásán és az egyenként több milliárd dollárba kerülő hatalmas adatközpontokban történő hálózatba kapcsolásán múlik. Ha a Szilícium-völgy vezetői szerint a mesterséges intelligenciához ilyen léptékű építkezésre van szükség, akkor ezt csak az olyan óriások engedhetik meg maguknak, mint a Microsoft, a Meta, az Alphabet és az Amazon, vagy a gazdag befektetők által megtámogatott startupok, mint az OpenAI.

De egyesek szerint van más megoldás is. Alex Cheema, az EXO Labs társalapítója a startupok azon növekvő csoportjához tartozik, akik szerint a mesterséges intelligencia terén a siker abban rejlik, hogy világszerte megtalálják a kihasználatlan GPU-kat, és ezeket virtuális „elosztott” hálózatokba fűzzék össze az interneten keresztül. Ezek a chipek bárhol lehetnek - egy egyetemi kampuszon, egy irodában vagy egy tinédzser hálószobájában lévő játék PC-ben. "A mesterséges intelligencia alapvető korlátja a számítási kapacitás” - mondja Cheema. "Enélkül nem lehet versenyezni. De ha létrehozzuk ezt az elosztott hálózatot, talán sikerülhet”.

Ha ez működik, akkor a felállás lehetővé tenné a mesterséges intelligencia fejlesztőinek, hogy megkerüljék a legnagyobb technológiai vállalatokat, és jóval alacsonyabb költséggel versenyezzenek az OpenAI vagy a Google szervereivel. Ez a megközelítés a kínai DeepSeek által sikerre vitt technikákkal és más nyílt forráskódú modellekkel párosulva olcsóbbá teheti a mesterséges intelligencia fejlesztését.

A legfejlettebb GPU-kat az Nvidia gyártja. Egyik csúcsmodellje, a HGX H100 GPU-rendszer 70 kilót nyom, 35 000 alkatrészt tartalmaz, és negyedmillió dolláros áron indul. A kisebb, olcsóbb modelleket azonban már régóta használják más célokra, például videojátékok életre keltésére és kriptovaluták bányászatára. Az elosztott MI-hálózatok kihasználnák azokat az időszakokat, amikor ezek a chipek nem Call of Duty-t futtatnak vagy a bitcoin bányászatot hajtanak végre, és online összekapcsolnák őket, hogy együtt dolgozzanak az MI-rendszerek fejlesztésén. E hálózatok üzemeltetői fizetnének a GPU-tulajdonosoknak, vagy megkérhetnék őket, hogy adományozzák nekik a chipjeik idejét, ha a mesterséges intelligenciát jótékonysági célokra fejlesztik.

Jared Quincy Davis azt mondja, hogy amíg a Google tulajdonában lévő DeepMind kutatója volt, a vállalat többet költött a számítástechnikai erőforrásokra, mint az emberekre. 2022-ben távozott, és létrehozta a Foundry nevű céget, egy olyan platformot, ahol az ügyfelek szabad GPU-kat kereshetnek és bérbe adhatják saját, nem kihasznált GPU-ikat. A vállalkozók váratlan helyeken találják meg ezeket a megüresedett erőforrásokat. Cheemát nemrég mutatták be egy kanadai ügyvédi irodának, amely egy GPU-klasztert hozott létre, amelyet a telephelyükön üzemeltetnek. "Amíg ők otthon alszanak, ezek a GPU-k nem csinálnak semmit” - mondja.

A nemrégiben alapított Exo Labs a küldetésének a mesterséges intelligenciához való hozzáférés demokratizálását nevezi meg. A cég még a kezdeti szakaszban van, mert GPU-kat keres, hogy összeállíthasson egy hálózatot. Cheema becslése szerint szervezetek ezreinek van akár százas nagyságrendben GPU-ja, amelyeket általában nem használnak. "Összességében nagyobb számítási kapacitásról van szó, mint amivel például az X rendelkezik” - mondja, utalva Musk startupjára, amely tavaly egy 100 000 GPU-s klasztert épített egy Tennessee-i adatközpontban.

Eddig még senki sem épített ilyen méretű virtuális GPU-hálózatot. A létezők többségének csak néhány száz GPU-ja van, és még rengeteg akadályt kell leküzdeni. A legfontosabb a sebesség. Egy elosztott hálózat csak olyan gyors, mint a leglassabb internetkapcsolat, míg az ugyanabban az adatközpontban lévő chipeknél gyakorlatilag nincs késleltetés. Az sem egyértelmű, hogy a GPU-k hálózata elég biztonságos-e ahhoz, hogy valaki személyes adatai ne szivárogjanak ki. És egyáltalán, hogyan lehet megtalálni azokat az embereket és vállalatokat, akiknek van felesleges chipjük?


Egy másik probléma: a mesterséges intelligenciamodellek létrehozása költséges vállalkozás, és az ilyen projekteket finanszírozó emberek általában idegenkednek a további kockázatoktól. Vipul Prakash, a Together.AI vezérigazgatója eredetileg azért alapította a vállalatot, hogy decentralizált GPU-hálózatot hozzon létre, majd áttért az adatközpontokon belüli munkára. "Az olyan emberek, akik egymilliárdot fektetnek be egy modell kiképzésébe, általában konzervatívak” - mondja. "Sok pénzt költenek, és már így is sok más típusú rizikót vállalnak, és nem akarnak infrastrukturális téren is kockáztatni.”

A decentralizált utat követő alapítók elismerik ezeket a kihívásokat, de azzal érvelnek, hogy a gazdaságnak és a vállalkozóknak nem tesz jót, ha a számítási erőforrások néhány hatalmas techcég kezében összpontosulnak. Azt is mondják, hogy nincs szükségük bő számítási kapacitáshoz való hozzáférésre ahhoz, hogy elősegítsék az új MI-vállalkozások felvirágzását, és ezt a DeepSeek sikere is bizonyítja.

Paul Hainsworth, a Berkeley Compute decentralizált MI-vállalat vezérigazgatója szerint van egy ügyfele, aki egy olyan élvonalbeli MI-modellt szeretne építeni, amely nagyobb, mint a Meta által üzemeltetett legnagyobb, amely az idei év végére 1,3 millió GPU-val tervezi befejezni. Hainsworth tavaly alapított startupja együttesen mintegy 900 GPU-val rendelkezik, két adatközpontban - az egyik Wyomingban, a másik Kaliforniában. Emellett olyan módszert is fejleszt, amellyel az emberek pénzügyi eszközként birtokolhatják a GPU-kat, amelyeket bérbe adhatnak, mint egy nyaralót. „Nagy téttel fogadok arra, hogy a nagy technológiai cégek tévednek, hogy az összes érték egy központi helyre kerül” - mondja Hainsworth.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • Fefy #11
    Köszönjük a kiselőadást. Kb mindenki tudja, hogy a SETI@Home hogyan működött. kvp arra akart kilyukadni, hogy ugyanezen a módon AI-s adatokat is fel lehet dolgozni, mert semmi különbség nincs a kettő között. Ha jól emlékszem, nem egy olyan kezdeményezés volt, ami GPU-t is tudott használni (nem pont a SETI@Home-ra gondolok, de sok más projekthez is lehetett csatlakozni), na most pont erre van szükség. Az AI-os számítás is csak számítás. A jól megírt kód eleve masszívan párhuzamos, így nem hiszem, hogy nagyon nagy munka lenne szétküldeni több gépre is a feladatot.
  • t_robert #10
    A dolog ahhoz hasonlít, mikor egyszerre 10-en beszélnek és egy kivehetetlen hangzavar lesz az eredmény. Lényegében ha sikerül a 10 hangot szétzedni kölön hangokra, akkor meg lehet nézni, hogy valamelyik beszélő hátha mond valami értelmeset is. :) pár érdekes jelet találtak de jobban megvizsgálva kiderült, hogy természetesek kvazárok és egyéb jelenségek sugározzák vagy sikerült valami földi jelet rögziteni. De nem sikerül ET üzenetét megtalálni. Ami persze nem zárja ki, hogy ET üzen csak nem biztos, hogy akkor amikor figyeljük, nem abból az irányból nem azon a frekvencián, ha egyáltalán ET rádióhullámot használ kommunikációhoz. :) Ha létezik ET vagy bármilyen szétszórt civilizációk nem a leghatékonyabb kommunikációs forma a lassú rádió hullám. Lehet, hogy ET már el is feljetette az elavult rádióhullámos kommunikációt, mert nincsen sok ezer éve elküldeni egy üzenetet és megvárni a választ. :) Lehet, hogy valami hiperűri kommunikációba kéne belehallgatni és akkor hatalmas hangzavart hallanánk ahogy mindenki cseveg mindenkivel. Már ha létezik. :) Amúgy meg a elvben párhuzamos időtartományban esetleg létező civilizációk egy időben léteznek. Lehet üzent ET 100 ezer éve, mikor ö9seink a barlangban melegetek és esélyünk nem volt felfogni egy rádió hullámot. Vagy ha mi üzenünk valkinek lehet meg se hallja mert rossz helyre megy és roszkor z adás. Már 1 millió éve nem használnak roppant primitiv rádió hullámot, vagy 1 millió év múlva fognak arra a szintre érni műszakilag, hogy képesek legyenek felfogni. Szóval a SETI milliárdszor esélytelenebb volt valamit találni, mint tüt keresni a szénakazalban. :) Megpróbáltuk még én is elemeztem pár ezer órát... :)
  • t_robert #9
    A SETI adatelmzés nem AI alapon ment, hanem a bejövő frekvenciák rögzitett adatait cincálták szét keresve benne a szabályos jel sorozatokat. Amikor egymás közeli ferkvenciákon több jel sorozat érkezik akkor összeadodnak és eltorzítják egymást és egy köztes jel keletkezik. ezeket az össze keveredet frekvenciálat probálják szét választani, hogy a zajból előkerüljen egy esetleges szabályos jel sorozat. Ezt úgynevezett fourier-transzformáció számolásával próbálják szétszedni. Aztán a szét szedett frekvenciákon keresnek szabályos jel sorozatokat. A SETI feldolgozásban ezt végezték a gépeink. Letötltött ha jól dereng egy valamilyen frekvencián rögzitett nagyjából 108 másodpercnyi adatot és azt dolgozta fel a PC. Aztán mikor végzett az adatcsomag feldolgozással visszaküldte a szervernek az eredményt. Aztán 2020-ban összeomlott a detektort tartó oszlop és a több tonnás detektor belezuhant a tányérba. Egy a földbe sülyesztett 300 méteres rádió teleszkopról van szó. Ahol a detektort mozgatták a tányér felett úgy változtatva az irányt és a fokuszt. Annyira megsérült a teleszkóp, hogy üzemen kivül helyezték. öreg volt már és nem érte meg kijavítani. Azt hiszem talán Puerto Rico-ban üzemelt a rádió lokátor.
  • kvp #8
    Ez gyakorlatilag ugyanaz mint a seti@home volt, csak MI celjara es for profit alapon. Az egyetlen ahol mukodhet az nagyvallalati kornyezet, de ott is inkabb ugy, hogy egy nagyvallalat a sajat folos kapacitasat hasznalja a sajat MI modelljeihez.

    ps: A seti-s project is a berkeley-rol jott, szoval valoszinuleg ugyanazt a tudast es kodbazist probaljak ujrahasznositani csak most MI celjara.
  • t_robert #7
    Olyan viszont létezik, hogy nagyobb cégek akiknek van nagyobb adminsztációja és irodaháza akár sok száz vagy ezer számítógéppel du bekapcsolva hagyják az irodai gépeket, amik egy felügyeleti profram alá kerülnek és az osztott erőforrásként használja éjjel a sokszáz PC sok ezer magját modellezési feladatokhoz. Például egy autóipari cég a PC-ken számol ki szélcsatorna mérési adatokat. vagy más modellezási infókat. Nem vesz a cég magának sok ezer magos szervereket több száz ezer dollárért, A sok száz ezer vagy millió dolláros szerverekkel és szerverfarmokkal az a gond cég szinten, hogy rengeteg a feleleges nem kihasznált kapacitás. Örülnek ha sikerül 20-30%-ban kihasználni a drága szerverek teljesítményét. Az idő nagy részében kihasználatlan a gép. Próbálják bérbe adni a teljesítményt. több kevesebb sikerrel. Más cégek szintén nem tartanak fent saját kapacítást, ha szükség van teljesítményre egyszerűen bérbe vesznek a szükséges idő pár ezer vagy több tiz ezer teljesítményt és használják addig amig szükség van rá. Rengetek a kihasználatln felesleges kapacítás a szervereken. Örülnek ha sikerül valakinek valamennyit értékesíteni a kihasználatlan kapacításokból.
  • t_robert #6
    Most tekintsünk el attól az alapvető ténytől, hogy az irodai munkára használt számítógépekben reéetíve ritka a dedikált grafika. Mivel nincsen rá szükség. Egy titkárnőek vagy egy ügyintézőnek, de egy raktárban se jellemző mondjuk az RTX 5090-es grafika. De még Ultra Core PC-ket se igazán vesznek, amiben van legalább valami CPU-ban levő AI támogatás. A világban használt PC-k döntő részének nincsen dedikált grafikai kártyája. Lehet, hogy meglepő de jó ha PC-k 5-10%-van felkészitve játékra.
  • Gabbbbbbbbbbbb #5
    >És ki garantálja, hogy csak a GPU-t használják és nem lopnak el semmit se a gépekről?

    Nyilván senki, de ez minden szoftverre igaz, főleg rootkit alapú anticheat-es játék címekre.

    ---

    Gyanítom nem fizetnének eleget a gpu időért. (ugye sok áram fogy és az amortizáció is brutális)
  • szoftos #4
    En csak annyit mondok hogy bittensor. Mindenkinek ajanlom. :)
  • codaco #3
    És ki garantálja, hogy csak a GPU-t használják és nem lopnak el semmit se a gépekről?
  • zriboliv #2
    Micsoda ötlet; ha megnyitom a budimat idegenek előtt és belépőt szedek azért, hogy használhassák, akkor mindenki jól jár.