Kína nyílt MI-modelljeivel szép lassan háttérbe szorítja Amerikát

Míg az amerikai technológiai óriások hatalmas összegeket költenek arra, hogy megismerjék riválisaik saját fejlesztésű mesterséges intelligencia modelljeinek titkait, Kínában egy másik csata zajlik. Andrew Ng, a Stanford Egyetem MI-szakértője nemrégiben „darwini élet-halál küzdelemnek” nevezte a kínai, nyitottabb nagy nyelvi modellek (LLM) fejlesztői közötti versengést. Lelkesedésüknek figyelmeztető jelzésnek kell lennie a Nyugat számára.

Januárban a DeepSeek nevű kínai startup megrázta a globális tőzsdéket azzal, hogy ingyenesen elérhetővé tette a szűkös költségvetésből fejlesztett fejlett MI-modelljét. Azóta az Alibaba nevű technológiai óriás és más kínai cégek modelljeinek népszerűsége csendben tovább nő külföldön. Amikor manapság vállalkozók lépnek be az Andreessen Horowitz (a16z) nevű nagy amerikai kockázati tőke társaság irodájába, nagy az esélye, hogy startupjaik Kínában készült MI-modelleket használnak. "Azt mondanám, hogy 80% az esélye, hogy kínai nyílt forráskódú modellt használnak” - mondja Martin Casado, az a16z partnere.

Szigorúan fogalmazva Kína a nyílt súlyú modellekre specializálódott. Az open source szoftverekkel ellentétben - amelyek forráskódja nyilvánosan megosztásra kerül, hogy bárki módosíthassa - a legtöbb nem tulajdonosi LLM csak a képzés során megtanult numerikus paramétereket (vagy "súlyokat”) biztosítja, és nem a forráskódot vagy az alapul szolgáló adatokat. De nevezzük őket annak, aminek akarjuk, a különböző intelligencia teszteken a kínai modellek idén jobb teljesítményt nyújtottak, mint hasonlóan nyitott amerikai társaik, például a Meta, a közösségi média óriás termékei. Sőt, képességeik egyre közelebb kerülnek a legjobb tulajdonosi modellekhez.

A ChatGPT gyártója, az OpenAI jól illusztrálja az ebből fakadó nyomást. A 2010-es évek végén még az MI nyitottabb megközelítését népszerűsítette (innen a neve), de hogy pénzt keressen és megakadályozza az egyre erősebb MI visszaéléseit, 2023-ban áttért kizárólag tulajdonosi LLM-ek értékesítésére. Az utóbbi időben azonban megnőtt ügyfelei körében a nyílt súlyú modellek használata, beleértve a kínaiakat is, és a cég is be akar szállni a játékba. A cég ebben a hónapban kiadta 2019 óta első nyílt súlyú nyelvi modelljét, a gpt-oss-t.

A kisbetűk használata sokatmondó. A modell viszonylag kicsi. Ugyanebben a héten az OpenAI bemutatta a régóta várt - és csalódást keltő - GPT-5-öt, a legújabb saját fejlesztésű modelljét. Az időzítés miatt az OpenAI nyitottságra való törekvése félszívűnek tűnt. Ez más amerikai vállalatok erőfeszítéseire is igaz lehet. Ali Farhadi, egy seattle-i székhelyű nonprofit szervezet, az Allen Institute for AI munkatársa szerint míg a kínai cégek mindent egy lapra tesznek fel, és nyíltan kiadják legjobb modelljeiket, az amerikaiak a „csillogó újdonságokat” saját tulajdonukban tartják. "Bármennyire is nehéz ezt elfogadnunk, szerintem most lemaradtunk a nyílt súlyok terén” - mondja.

A Meta is megerősíti ezt az elképzelést. Az open source világban széles körben ünnepelték, hogy a Llama-t nyíltá és széles körben elérhetővé tették. De Mark Zuckerberg, a cég vezetője, most az úgynevezett szuperintelligencia fejlesztésére koncentrál. A jövőben a cége óvatosabb lesz azzal kapcsolatban, hogy mit tesz nyíltá, mondta.

Üzleti szempontból mennyire fontos ez? Végül is az amerikai saját fejlesztésű modellek által generált bevételek messze meghaladják a kínai nyílt súlyú modellek által termelt bevételeket. Az előbbiek értéke - az OpenAI esetében akár 500 milliárd dollár - eltörpül az utóbbiaké mellett; az Alibaba teljes piaci kapitalizációja csak 285 milliárd dollár. A saját fejlesztésű modellekkel könnyebb pénzt keresni, és a bevételeket vissza lehet forgatni az innovációba.

Az open source azonban nem csak a másodhegedűsöknek való. Percy Liang, a Together AI, egy nyílt súlyú LLM-eket ötvöző platform társalapítója szerint a nyílt modellek másfajta alkalmazási formákat ösztönöznek, mint a saját fejlesztésű technológia. A vállalatok, kormányok és kutatók könnyebben tudják őket az egyes felhasználási esetek „minden zugához” igazítani, és segítenek a felhasználóknak az MI-eszközeiket helyben futtatni, ahelyett, hogy a felhőre támaszkodnának. A kiegészítő szolgáltatásokból, például a testreszabás támogatásából továbbra is komoly pénzt lehet keresni.

Más szavakkal, míg az amerikai laboratóriumok nagy összegeket fektetnek az intelligencia határainak feszegetésébe, addig nyílt súlyú kínai riválisaik inkább az MI alkalmazásának ösztönzésére koncentrálnak. Ha sikerrel járnak, a DeepSeek-sokk csak a kezdet lehet.

De jó hogy valaki ismeri ezt a szemléletet. 😊

Szerintem az a gond, hogy az LLM alapú AI-nek nevezett eszközzel hosszútávon inkább csak a "bazár" világának megfelelő termékekeket lehet gyártani, tekintve, hogy (szerintem) soha nem lesz képes 100%-ban adekvát, hiteles válasz megadására, ami bármilyen állami/mérnöki/tudományos szférában használatos terméknél egyfajta követelmény.

Pl egy AI-val támogatott építészeti/CAD szoftver ne akarjon már a fizikát illetően kreatívkodni, haluzni, ami sajnos jellemző a jelenlegi AI megoldásokra.

Marketingben, dizájnban, művészetben egy meglepően hatékony eszköz lehet, és az is, ahogy ezt bizonyította, de nem "komolyabb" alkalmazási területeken.

A zárt forrás, az esetleges magas szintű vállalati támogatás, nem képes kiküszöbölni az LLM lényegéből fakadó hátrányokat, így értelmetlen az open source megoldásokhoz képest a területbe jelentősen többet invesztálni.
A kínaiak ráadásul erre is rátesznek egy lapáttal, amikor az államilag támogatott open source cégeikkel széttrolkodják az egész AI világpiacot.

Kína nyílt MI-modelljeivel szép lassan háttérbe szorítja Amerikát

Kapcsolódó cikkek és linkek

Hozzászólások