A kínai cégek külföldön tréningezik MI-modelljeiket, hogy Nvidia chipeket használhassanak

A vezető kínai vállalatok külföldön képzik mesterségesintelligencia-modelljeiket, hogy hozzáférjenek az Nvidia chipjeihez, és megkerüljék az Egyesült Államok erőfeszítéseit, amelyek célja, hogy megakadályozzák a technológia fejlesztését.

Az Alibaba és a ByteDance azon technológiai csoportok közé tartozik, amelyek legújabb nagy nyelvi modelljeiket Délkelet-Ázsiában található adatközpontokban képzik. Folyamatos növekedés figyelhető meg a külföldi helyszíneken végzett modellképzésben, miután az Egyesült Államok áprilisban lépéseket tett az Nvidia Kínának szánt H20-as félvezetőinek értékesítésének korlátozására. „Nyilvánvaló választás ide jönni” - mondta egy szingapúri adatközpont-üzemeltető. „A legjobb chipekre van szükséged ahhoz, hogy a legmodernebb modelleket képezd, és ez itt teljesen jogszerűen megtehető.”

Az elmúlt egy év során az Alibaba Qwen és a ByteDance Doubao modelljei a világ legjobban teljesítő nagy nyelvi modelljei közé emelkedtek. A Qwen ráadásul Kínán kívül is széles körben elterjedt a fejlesztők körében, mivel szabadon hozzáférhető, un. „nyílt” modell. Az adatközpont-klaszterek robbanásszerűen fejlődnek Szingapúrban és Malajziában, amit jelentős kínai kereslet hajt. Ezek közül sok központ csúcskategóriás Nvidia termékekkel van felszerelve, hasonlóakkal, mint amelyeket az amerikai nagy technológiai vállalatok használnak LLM-ek tanítására.

A gyakorlattal kapcsolatban jártas személyek szerint a kínai cégek általában bérleti szerződést kötnek olyan külföldi adatközpontok használatára, amelyeket nem kínai tulajdonban lévő vállalatok birtokolnak és üzemeltetnek. Ez összhangban áll az amerikai exportellenőrzési szabályokkal, mivel a Joe Biden-adminisztráció által bevezetett, a kiskapu bezárására szolgáló úgynevezett „diffusion rule”-t Donald Trump elnök korábban eltörölte.

Egyetlen kivétel a DeepSeek, a kiváló minőségű és alacsony költségű MI-modellek fejlesztője, amelyet belföldön képeznek, de az a vállalat még az amerikai exporttilalmak életbe lépése előtt jelentős mennyiségű Nvidia chipre tett szert, továbbá szorosan együttműködik a hazai chipgyártókkal, élükön a Huaweijel, hogy optimalizálja és továbbfejlessze a kínai MI-chipek következő generációját. A Huawei mérnökökből álló csapatot állomásoztat a DeepSeek hangcsoui központjában. A vállalat stratégiai erőfeszítésként tekint partnerségére a DeepSeekkel, amelynek célja a félvezetői és szoftverrendszerek fejlesztése, hogy azokat az ország szerte alkalmazzák MI-képzésben.

Az LLM-ek képzéséhez hatalmas mennyiségű számítási kapacitásra van szükség óriási adathalmazok feldolgozásához, ezért a legtöbb kínai csoport továbbra is az Nvidia fejlett termékeit részesíti előnyben ehhez a feladathoz. Ugyanakkor ezek a vállalatok egyre gyakrabban fordulnak hazai gyártású kínai chipekhez a következtetés, az úgynevezett „inferencia” során, amikor az MI-rendszer válaszol a felhasználó kérésére. Ez a folyamat az összes MI-feladat egyre növekvő részét teszi ki.

A képzésen túl a kínai technológiai cégek a délkelet-ázsiai adatközpontokat használják arra is, hogy kiszolgálják tengerentúli ügyfeleiket, mivel az Alibaba és a ByteDance növelni kívánja részesedését a globális felhőszolgáltatási piacon. A kínai vállalatok más régiókban, például a Közel-Keleten is bővítik adatközpont-elérhetőségüket. Korlátozó tényező azonban, hogy a kínai technológiai csoportok nem vihetnek ki személyes adatokat az országból. Ez azt jelenti, hogy ha egy helyi ügyfél által biztosított, specifikus adatok alapján kell testre szabni egy MI-modellt, akkor a képzésnek Kínában kell maradnia.

A kínai cégek külföldön tréningezik MI-modelljeiket, hogy Nvidia chipeket használhassanak

Kapcsolódó cikkek és linkek

Hozzászólások