SG.hu
Kína nyílt MI-modelljeivel szép lassan háttérbe szorítja Amerikát
Míg az amerikai technológiai óriások hatalmas összegeket költenek arra, hogy megismerjék riválisaik saját fejlesztésű mesterséges intelligencia modelljeinek titkait, Kínában egy másik csata zajlik. Andrew Ng, a Stanford Egyetem MI-szakértője nemrégiben „darwini élet-halál küzdelemnek” nevezte a kínai, nyitottabb nagy nyelvi modellek (LLM) fejlesztői közötti versengést. Lelkesedésüknek figyelmeztető jelzésnek kell lennie a Nyugat számára.
Januárban a DeepSeek nevű kínai startup megrázta a globális tőzsdéket azzal, hogy ingyenesen elérhetővé tette a szűkös költségvetésből fejlesztett fejlett MI-modelljét. Azóta az Alibaba nevű technológiai óriás és más kínai cégek modelljeinek népszerűsége csendben tovább nő külföldön. Amikor manapság vállalkozók lépnek be az Andreessen Horowitz (a16z) nevű nagy amerikai kockázati tőke társaság irodájába, nagy az esélye, hogy startupjaik Kínában készült MI-modelleket használnak. "Azt mondanám, hogy 80% az esélye, hogy kínai nyílt forráskódú modellt használnak” - mondja Martin Casado, az a16z partnere.
Szigorúan fogalmazva Kína a nyílt súlyú modellekre specializálódott. Az open source szoftverekkel ellentétben - amelyek forráskódja nyilvánosan megosztásra kerül, hogy bárki módosíthassa - a legtöbb nem tulajdonosi LLM csak a képzés során megtanult numerikus paramétereket (vagy "súlyokat”) biztosítja, és nem a forráskódot vagy az alapul szolgáló adatokat. De nevezzük őket annak, aminek akarjuk, a különböző intelligencia teszteken a kínai modellek idén jobb teljesítményt nyújtottak, mint hasonlóan nyitott amerikai társaik, például a Meta, a közösségi média óriás termékei. Sőt, képességeik egyre közelebb kerülnek a legjobb tulajdonosi modellekhez.
A ChatGPT gyártója, az OpenAI jól illusztrálja az ebből fakadó nyomást. A 2010-es évek végén még az MI nyitottabb megközelítését népszerűsítette (innen a neve), de hogy pénzt keressen és megakadályozza az egyre erősebb MI visszaéléseit, 2023-ban áttért kizárólag tulajdonosi LLM-ek értékesítésére. Az utóbbi időben azonban megnőtt ügyfelei körében a nyílt súlyú modellek használata, beleértve a kínaiakat is, és a cég is be akar szállni a játékba. A cég ebben a hónapban kiadta 2019 óta első nyílt súlyú nyelvi modelljét, a gpt-oss-t.
A kisbetűk használata sokatmondó. A modell viszonylag kicsi. Ugyanebben a héten az OpenAI bemutatta a régóta várt - és csalódást keltő - GPT-5-öt, a legújabb saját fejlesztésű modelljét. Az időzítés miatt az OpenAI nyitottságra való törekvése félszívűnek tűnt. Ez más amerikai vállalatok erőfeszítéseire is igaz lehet. Ali Farhadi, egy seattle-i székhelyű nonprofit szervezet, az Allen Institute for AI munkatársa szerint míg a kínai cégek mindent egy lapra tesznek fel, és nyíltan kiadják legjobb modelljeiket, az amerikaiak a „csillogó újdonságokat” saját tulajdonukban tartják. "Bármennyire is nehéz ezt elfogadnunk, szerintem most lemaradtunk a nyílt súlyok terén” - mondja.
A Meta is megerősíti ezt az elképzelést. Az open source világban széles körben ünnepelték, hogy a Llama-t nyíltá és széles körben elérhetővé tették. De Mark Zuckerberg, a cég vezetője, most az úgynevezett szuperintelligencia fejlesztésére koncentrál. A jövőben a cége óvatosabb lesz azzal kapcsolatban, hogy mit tesz nyíltá, mondta.
Üzleti szempontból mennyire fontos ez? Végül is az amerikai saját fejlesztésű modellek által generált bevételek messze meghaladják a kínai nyílt súlyú modellek által termelt bevételeket. Az előbbiek értéke - az OpenAI esetében akár 500 milliárd dollár - eltörpül az utóbbiaké mellett; az Alibaba teljes piaci kapitalizációja csak 285 milliárd dollár. A saját fejlesztésű modellekkel könnyebb pénzt keresni, és a bevételeket vissza lehet forgatni az innovációba.
Az open source azonban nem csak a másodhegedűsöknek való. Percy Liang, a Together AI, egy nyílt súlyú LLM-eket ötvöző platform társalapítója szerint a nyílt modellek másfajta alkalmazási formákat ösztönöznek, mint a saját fejlesztésű technológia. A vállalatok, kormányok és kutatók könnyebben tudják őket az egyes felhasználási esetek „minden zugához” igazítani, és segítenek a felhasználóknak az MI-eszközeiket helyben futtatni, ahelyett, hogy a felhőre támaszkodnának. A kiegészítő szolgáltatásokból, például a testreszabás támogatásából továbbra is komoly pénzt lehet keresni.
Más szavakkal, míg az amerikai laboratóriumok nagy összegeket fektetnek az intelligencia határainak feszegetésébe, addig nyílt súlyú kínai riválisaik inkább az MI alkalmazásának ösztönzésére koncentrálnak. Ha sikerrel járnak, a DeepSeek-sokk csak a kezdet lehet.
Januárban a DeepSeek nevű kínai startup megrázta a globális tőzsdéket azzal, hogy ingyenesen elérhetővé tette a szűkös költségvetésből fejlesztett fejlett MI-modelljét. Azóta az Alibaba nevű technológiai óriás és más kínai cégek modelljeinek népszerűsége csendben tovább nő külföldön. Amikor manapság vállalkozók lépnek be az Andreessen Horowitz (a16z) nevű nagy amerikai kockázati tőke társaság irodájába, nagy az esélye, hogy startupjaik Kínában készült MI-modelleket használnak. "Azt mondanám, hogy 80% az esélye, hogy kínai nyílt forráskódú modellt használnak” - mondja Martin Casado, az a16z partnere.
Szigorúan fogalmazva Kína a nyílt súlyú modellekre specializálódott. Az open source szoftverekkel ellentétben - amelyek forráskódja nyilvánosan megosztásra kerül, hogy bárki módosíthassa - a legtöbb nem tulajdonosi LLM csak a képzés során megtanult numerikus paramétereket (vagy "súlyokat”) biztosítja, és nem a forráskódot vagy az alapul szolgáló adatokat. De nevezzük őket annak, aminek akarjuk, a különböző intelligencia teszteken a kínai modellek idén jobb teljesítményt nyújtottak, mint hasonlóan nyitott amerikai társaik, például a Meta, a közösségi média óriás termékei. Sőt, képességeik egyre közelebb kerülnek a legjobb tulajdonosi modellekhez.
A ChatGPT gyártója, az OpenAI jól illusztrálja az ebből fakadó nyomást. A 2010-es évek végén még az MI nyitottabb megközelítését népszerűsítette (innen a neve), de hogy pénzt keressen és megakadályozza az egyre erősebb MI visszaéléseit, 2023-ban áttért kizárólag tulajdonosi LLM-ek értékesítésére. Az utóbbi időben azonban megnőtt ügyfelei körében a nyílt súlyú modellek használata, beleértve a kínaiakat is, és a cég is be akar szállni a játékba. A cég ebben a hónapban kiadta 2019 óta első nyílt súlyú nyelvi modelljét, a gpt-oss-t.
A kisbetűk használata sokatmondó. A modell viszonylag kicsi. Ugyanebben a héten az OpenAI bemutatta a régóta várt - és csalódást keltő - GPT-5-öt, a legújabb saját fejlesztésű modelljét. Az időzítés miatt az OpenAI nyitottságra való törekvése félszívűnek tűnt. Ez más amerikai vállalatok erőfeszítéseire is igaz lehet. Ali Farhadi, egy seattle-i székhelyű nonprofit szervezet, az Allen Institute for AI munkatársa szerint míg a kínai cégek mindent egy lapra tesznek fel, és nyíltan kiadják legjobb modelljeiket, az amerikaiak a „csillogó újdonságokat” saját tulajdonukban tartják. "Bármennyire is nehéz ezt elfogadnunk, szerintem most lemaradtunk a nyílt súlyok terén” - mondja.
A Meta is megerősíti ezt az elképzelést. Az open source világban széles körben ünnepelték, hogy a Llama-t nyíltá és széles körben elérhetővé tették. De Mark Zuckerberg, a cég vezetője, most az úgynevezett szuperintelligencia fejlesztésére koncentrál. A jövőben a cége óvatosabb lesz azzal kapcsolatban, hogy mit tesz nyíltá, mondta.
Üzleti szempontból mennyire fontos ez? Végül is az amerikai saját fejlesztésű modellek által generált bevételek messze meghaladják a kínai nyílt súlyú modellek által termelt bevételeket. Az előbbiek értéke - az OpenAI esetében akár 500 milliárd dollár - eltörpül az utóbbiaké mellett; az Alibaba teljes piaci kapitalizációja csak 285 milliárd dollár. A saját fejlesztésű modellekkel könnyebb pénzt keresni, és a bevételeket vissza lehet forgatni az innovációba.
Az open source azonban nem csak a másodhegedűsöknek való. Percy Liang, a Together AI, egy nyílt súlyú LLM-eket ötvöző platform társalapítója szerint a nyílt modellek másfajta alkalmazási formákat ösztönöznek, mint a saját fejlesztésű technológia. A vállalatok, kormányok és kutatók könnyebben tudják őket az egyes felhasználási esetek „minden zugához” igazítani, és segítenek a felhasználóknak az MI-eszközeiket helyben futtatni, ahelyett, hogy a felhőre támaszkodnának. A kiegészítő szolgáltatásokból, például a testreszabás támogatásából továbbra is komoly pénzt lehet keresni.
Más szavakkal, míg az amerikai laboratóriumok nagy összegeket fektetnek az intelligencia határainak feszegetésébe, addig nyílt súlyú kínai riválisaik inkább az MI alkalmazásának ösztönzésére koncentrálnak. Ha sikerrel járnak, a DeepSeek-sokk csak a kezdet lehet.