SG.hu
Kína nem tud felzárkózni MI-terén, ha a nyílt amerikai modellektől függ
A kínai technológiai cégeket váratlanul érte a generatív mesterséges intelligencia területén elért áttörés, és a helyzeten az erős kormányzati szabályozás és a lanyhuló gazdaság sem segít. Riporterek több, mint egy tucatnyi MI-szakértőt kérdeztek meg Kína versenyképességéről ezen a kritikus területen.
Novemberben, egy évvel a ChatGPT megjelenése után, egy viszonylag ismeretlen kínai startup cég ugrott az élre egy olyan ranglistán, amely a nyílt forráskódú mesterséges intelligencia rendszerek képességeit értékelte. A 01.AI nevű kínai cég mindössze nyolc hónapos volt, de gazdag támogatókkal és 1 milliárd dolláros értékeléssel rendelkezett, és egy ismert befektető és szakember, Kai-Fu Lee alapította. Lee az interjúkban az általa kifejlesztett mesterséges intelligencia rendszert olyan alternatívaként mutatta be, mint a Meta generatív mesterséges intelligencia modellje, a LLaMA. Csak egy csavar volt: a 01.AI rendszerének technológiája nem alternatívája a Meta modelljének, hanem a LLaMA alapjaira épült. Lee startupja csupán új adatokkal képezte ki a rendszerét, hogy még hatékonyabbá tegye azt. A Meta globális ügyeit irányító Nick Clegg szerint a nyíltság nem hiba, a vállalat MI-modelljeinek megosztása segít elterjeszteni a vállalat értékeit és szabványait, és ezzel hozzájárul az amerikai vezető szerep biztosításához.
A helyzet jól példázza azt a valóságot, amelyet Kínában sokan nyíltan beismernek. Még akkor is, amikor az ország versenyt fut a generatív MI kiépítéséért, a kínai vállalatok szinte teljes mértékben az Egyesült Államokból származó alaprendszerekre támaszkodnak. Több mint egy tucat technológiai iparági bennfentes és vezető mérnök szerint Kína legalább egy évvel le van maradva az Egyesült Államokhoz képest MI terén, és lehet, hogy még jobban le fog maradni, ami a két nemzet közötti, egyesek szerint hidegháborúhoz hasonlítható, gyilkos technológiai verseny új szakaszát vetíti előre.
"A kínai vállalatokra óriási nyomás nehezedik, hogy lépést tartsanak az amerikai innovációkkal" - mondta Chris Nicholson, a Page One Ventures kockázati tőkecég egyik befektetője, aki az MI-technológiákra összpontosít. A ChatGPT kiadása "egy újabb Szputnyik-pillanat volt, amelyre Kína úgy érezte, hogy válaszolnia kell". Jenny Xiao, a Leonis Capital befektetési cég partnere szerint a kínai vállalatok által a semmiből felépített MI-modellek "nem túl jók", ami ahhoz vezet, hogy sok kínai cég inkább a nyugati modellek "finomhangolt változatait" használja. Becslése szerint Kína két-három évvel van lemaradva az Egyesült Államokhoz képest a generatív MI fejlesztések terén.
Az MI elsőségért folytatott versengésnek óriási következményei vannak. A technológia áttörései felboríthatják a globális technológiai erőviszonyokat, növelve az emberek termelékenységét, segítve az iparágakat és jövőbeli innovációkat eredményezve, még akkor is, ha a nemzetek küzdenek a technológia kockázataival. Mivel a kínai cégek az Egyesült Államok nyílt forráskódú MI-modelljeihez fordulva igyekeznek felzárkózni, Washington nehéz helyzetben van. Még ha az Egyesült Államok a chipek értékesítésének korlátozásával és a befektetések visszafogásával próbálta is lassítani Kína fejlődését, a szoftverek nyílt kiadásának gyakorlatát nem akadályozta meg, hogy ösztönözze azok elfogadását.
Kína számára az Egyesült Államokból származó MI-rendszerekre - elsősorban a Meta LLaMA rendszerére - való támaszkodás mélyebb kérdéseket vet fel az ország innovációs modelljével kapcsolatban, amely az elmúlt évtizedekben sokakat meglepett azzal, hogy a pekingi tekintélyelvű ellenőrzés ellenére olyan világelső cégeket hozott létre, mint az Alibaba és a ByteDance. "Amikor a kínai vállalatok amerikai nyílt forráskódú technológiákat használnak fel, hogy felzárkózzanak, a kérdések nagyon bonyolulttá válnak - nemzetbiztonsági és geopolitikai kérdések merülnek fel" - mondta Oren Etzioni, a Washingtoni Egyetem professzora.
Az MI már régóta prioritás Kínában. Miután az AlphaGo 2016-ban legyőzte a Go társasjáték két legjobb játékosát, a kínai döntéshozók ambiciózus tervet fogalmaztak meg, hogy 2030-ra a világ élvonalába kerüljenek a technológia területén. A kormány milliárdokat ígért a területre összpontosító kutatóknak és vállalatoknak. Amikor az OpenAI 2022 novemberében kiadta a ChatGPT-t, számos kínai céget hátráltatott a pekingi szabályozási szigor, amely elriasztotta a kormányzati jóváhagyás nélküli kísérletezést. A kínai technológiai vállalatokat a közvélemény irányítására és a Kínai Kommunista Párttal szembeni nagyobb ellenzék elnémítására irányuló cenzúra szabályai is terhelték.
A generatív MI-modell létrehozásához szükséges erőforrásokkal rendelkező kínai vállalatok dilemmával szembesültek. Ha olyan chatbotot hoznak létre, amelyik rosszat mond, a készítői megfizetik az árát. És senki sem lehet biztos abban, hogy mi fog elhangzani egy chatbot digitális szájából. "Egyszerűen nem lehet megszabadulni az összes problémás dologtól, amellyel ezek a rendszerek kifejezhetik magukat" - mondta Andrew Ng, aki informatikát tanít a Stanfordon, és korábban a Baidu, a kínai keresőóriás egyik vezetője volt. A kínai technológiai óriások az új szabályozásokkal is megküzdöttek, amelyek előírják, hogyan lehet az MI modelleket betanítani. A szabályok korlátozzák a modellek képzéséhez felhasználható adatkészleteket és az elfogadható alkalmazásokat, valamint követelményeket támasztanak a modellek kormánynál történő regisztrációjával kapcsolatban.
Kína leginkább a lakosság elnyomása miatt, a gépi látás terén fejlesztette az MI-t
"A jelenlegi szabályozási rendszerben - amely még mindig mozgó célpont - nehezebb és kockázatosabb a generatív MI területén újítani" - véli Kevin Xu, az Interconnected Capital amerikai alapítója, akinek fedezeti alapja MI vállalkozásokba fektet be. A kínai technológiai befektetők is gyors megtérülést várnak az ágazatban, ami azt jelentette, hogy a pénz könnyen kivitelezhető alkalmazásokba áramlott az alapkutatásra összpontosító ambiciózusabb célok helyett - mondta Yiran Chen, a Duke Egyetem számítástechnika professzora. A kínai MI-beruházások 50 százaléka a megfigyeléshez szükséges számítógépes látás technológiájába ment, ahelyett, hogy a generatív alapmodelleket építettek volna ki - mondta.
A Baidu, az Alibaba, a Mengniu tejipari vállalat és a TAL Education oktató cég is beszállt a technológiai versenybe, amit a kínai média a "100 modell csatája" kifejezéssel írt le. Egyesek kritizálták a szabadversenyt, mint reklámfogást, amely felesleges - egy tavalyi panelbeszélgetésen Robin Li, a Baidu vezérigazgatója pazarlásnak nevezte, hogy több száz alapmodell van. "Több erőforrást kellene elkülöníteni a különböző iparágak alkalmazásaira, különösen a számítási kapacitásunk korlátait figyelembe véve" - mondta. A siker eddig elmaradt. Amikor a Baidu márciusban bemutatta Ernie nevű chatbotját, az "élő" bemutatóról kiderült, hogy előre felvett volt. A Baidu részvényei aznap 10 százalékot zuhantak. A kudarc ellenére a Baidu továbbra is egyike Kína azon kevés szereplőinek, amelyekkel a semmiből próbálnak egy alapmodellt felépíteni. A többit az Alibaba és a Tencent, a kínai technológiai óriások, valamint egy a Tsinghua Egyetemhez kapcsolódó startup cég vezeti.
Az Egyesült Államok által az MI-chipek Kínába történő értékesítésére vonatkozó korlátozások további kihívásokat jelentenek, mivel a generatív modellek képzéséhez sok ilyen lapkára van szükség. Többek között a Baidu és a 01.AI azt nyilatkozta, hogy elegendő chipet halmoztak fel ahhoz, hogy a közeljövőben is fenntartsák működésüket. Az ország leginkább a számítógépes látás és az autonóm járművek terén jeleskedik, de néhány kínai vállalkozó más területeken elért áttörésekkel is szeretné az Egyesült Államokat megelőzni.
Wang Changhu, a ByteDance MI laboratóriumának korábbi vezetője tavaly alapította meg Pekingben az AIsphere nevű vállalatot, hogy a technológia következő nagy határterületét, a videógenerálást kutassa. Novemberben a startup kiadta a PixVerse-t, egy mesterséges intelligenciával működő generátort, amely képes videót készíteni egy szöveges leírásból. "Előreléptünk, a modelljeinket az alapoktól kezdve építettük fel" - mondta Wang. "Ez jelentős előnyt jelent számunkra, hiszen igazi úttörők vagyunk a videogenerálás területén." Ez az előny talán csak néhány hónapig tartott. A múlt héten az OpenAI bemutatta a Sora nevű mesterséges intelligencia eszközt, amely egy egyszerű szöveges felszólítást olyan videókká alakít, amelyek úgy néznek ki, mintha egy hollywoodi filmből lettek volna átemelve.
Novemberben, egy évvel a ChatGPT megjelenése után, egy viszonylag ismeretlen kínai startup cég ugrott az élre egy olyan ranglistán, amely a nyílt forráskódú mesterséges intelligencia rendszerek képességeit értékelte. A 01.AI nevű kínai cég mindössze nyolc hónapos volt, de gazdag támogatókkal és 1 milliárd dolláros értékeléssel rendelkezett, és egy ismert befektető és szakember, Kai-Fu Lee alapította. Lee az interjúkban az általa kifejlesztett mesterséges intelligencia rendszert olyan alternatívaként mutatta be, mint a Meta generatív mesterséges intelligencia modellje, a LLaMA. Csak egy csavar volt: a 01.AI rendszerének technológiája nem alternatívája a Meta modelljének, hanem a LLaMA alapjaira épült. Lee startupja csupán új adatokkal képezte ki a rendszerét, hogy még hatékonyabbá tegye azt. A Meta globális ügyeit irányító Nick Clegg szerint a nyíltság nem hiba, a vállalat MI-modelljeinek megosztása segít elterjeszteni a vállalat értékeit és szabványait, és ezzel hozzájárul az amerikai vezető szerep biztosításához.
A helyzet jól példázza azt a valóságot, amelyet Kínában sokan nyíltan beismernek. Még akkor is, amikor az ország versenyt fut a generatív MI kiépítéséért, a kínai vállalatok szinte teljes mértékben az Egyesült Államokból származó alaprendszerekre támaszkodnak. Több mint egy tucat technológiai iparági bennfentes és vezető mérnök szerint Kína legalább egy évvel le van maradva az Egyesült Államokhoz képest MI terén, és lehet, hogy még jobban le fog maradni, ami a két nemzet közötti, egyesek szerint hidegháborúhoz hasonlítható, gyilkos technológiai verseny új szakaszát vetíti előre.
"A kínai vállalatokra óriási nyomás nehezedik, hogy lépést tartsanak az amerikai innovációkkal" - mondta Chris Nicholson, a Page One Ventures kockázati tőkecég egyik befektetője, aki az MI-technológiákra összpontosít. A ChatGPT kiadása "egy újabb Szputnyik-pillanat volt, amelyre Kína úgy érezte, hogy válaszolnia kell". Jenny Xiao, a Leonis Capital befektetési cég partnere szerint a kínai vállalatok által a semmiből felépített MI-modellek "nem túl jók", ami ahhoz vezet, hogy sok kínai cég inkább a nyugati modellek "finomhangolt változatait" használja. Becslése szerint Kína két-három évvel van lemaradva az Egyesült Államokhoz képest a generatív MI fejlesztések terén.
Az MI elsőségért folytatott versengésnek óriási következményei vannak. A technológia áttörései felboríthatják a globális technológiai erőviszonyokat, növelve az emberek termelékenységét, segítve az iparágakat és jövőbeli innovációkat eredményezve, még akkor is, ha a nemzetek küzdenek a technológia kockázataival. Mivel a kínai cégek az Egyesült Államok nyílt forráskódú MI-modelljeihez fordulva igyekeznek felzárkózni, Washington nehéz helyzetben van. Még ha az Egyesült Államok a chipek értékesítésének korlátozásával és a befektetések visszafogásával próbálta is lassítani Kína fejlődését, a szoftverek nyílt kiadásának gyakorlatát nem akadályozta meg, hogy ösztönözze azok elfogadását.
Kína számára az Egyesült Államokból származó MI-rendszerekre - elsősorban a Meta LLaMA rendszerére - való támaszkodás mélyebb kérdéseket vet fel az ország innovációs modelljével kapcsolatban, amely az elmúlt évtizedekben sokakat meglepett azzal, hogy a pekingi tekintélyelvű ellenőrzés ellenére olyan világelső cégeket hozott létre, mint az Alibaba és a ByteDance. "Amikor a kínai vállalatok amerikai nyílt forráskódú technológiákat használnak fel, hogy felzárkózzanak, a kérdések nagyon bonyolulttá válnak - nemzetbiztonsági és geopolitikai kérdések merülnek fel" - mondta Oren Etzioni, a Washingtoni Egyetem professzora.
Az MI már régóta prioritás Kínában. Miután az AlphaGo 2016-ban legyőzte a Go társasjáték két legjobb játékosát, a kínai döntéshozók ambiciózus tervet fogalmaztak meg, hogy 2030-ra a világ élvonalába kerüljenek a technológia területén. A kormány milliárdokat ígért a területre összpontosító kutatóknak és vállalatoknak. Amikor az OpenAI 2022 novemberében kiadta a ChatGPT-t, számos kínai céget hátráltatott a pekingi szabályozási szigor, amely elriasztotta a kormányzati jóváhagyás nélküli kísérletezést. A kínai technológiai vállalatokat a közvélemény irányítására és a Kínai Kommunista Párttal szembeni nagyobb ellenzék elnémítására irányuló cenzúra szabályai is terhelték.
A generatív MI-modell létrehozásához szükséges erőforrásokkal rendelkező kínai vállalatok dilemmával szembesültek. Ha olyan chatbotot hoznak létre, amelyik rosszat mond, a készítői megfizetik az árát. És senki sem lehet biztos abban, hogy mi fog elhangzani egy chatbot digitális szájából. "Egyszerűen nem lehet megszabadulni az összes problémás dologtól, amellyel ezek a rendszerek kifejezhetik magukat" - mondta Andrew Ng, aki informatikát tanít a Stanfordon, és korábban a Baidu, a kínai keresőóriás egyik vezetője volt. A kínai technológiai óriások az új szabályozásokkal is megküzdöttek, amelyek előírják, hogyan lehet az MI modelleket betanítani. A szabályok korlátozzák a modellek képzéséhez felhasználható adatkészleteket és az elfogadható alkalmazásokat, valamint követelményeket támasztanak a modellek kormánynál történő regisztrációjával kapcsolatban.
Kína leginkább a lakosság elnyomása miatt, a gépi látás terén fejlesztette az MI-t
"A jelenlegi szabályozási rendszerben - amely még mindig mozgó célpont - nehezebb és kockázatosabb a generatív MI területén újítani" - véli Kevin Xu, az Interconnected Capital amerikai alapítója, akinek fedezeti alapja MI vállalkozásokba fektet be. A kínai technológiai befektetők is gyors megtérülést várnak az ágazatban, ami azt jelentette, hogy a pénz könnyen kivitelezhető alkalmazásokba áramlott az alapkutatásra összpontosító ambiciózusabb célok helyett - mondta Yiran Chen, a Duke Egyetem számítástechnika professzora. A kínai MI-beruházások 50 százaléka a megfigyeléshez szükséges számítógépes látás technológiájába ment, ahelyett, hogy a generatív alapmodelleket építettek volna ki - mondta.
A Baidu, az Alibaba, a Mengniu tejipari vállalat és a TAL Education oktató cég is beszállt a technológiai versenybe, amit a kínai média a "100 modell csatája" kifejezéssel írt le. Egyesek kritizálták a szabadversenyt, mint reklámfogást, amely felesleges - egy tavalyi panelbeszélgetésen Robin Li, a Baidu vezérigazgatója pazarlásnak nevezte, hogy több száz alapmodell van. "Több erőforrást kellene elkülöníteni a különböző iparágak alkalmazásaira, különösen a számítási kapacitásunk korlátait figyelembe véve" - mondta. A siker eddig elmaradt. Amikor a Baidu márciusban bemutatta Ernie nevű chatbotját, az "élő" bemutatóról kiderült, hogy előre felvett volt. A Baidu részvényei aznap 10 százalékot zuhantak. A kudarc ellenére a Baidu továbbra is egyike Kína azon kevés szereplőinek, amelyekkel a semmiből próbálnak egy alapmodellt felépíteni. A többit az Alibaba és a Tencent, a kínai technológiai óriások, valamint egy a Tsinghua Egyetemhez kapcsolódó startup cég vezeti.
Az Egyesült Államok által az MI-chipek Kínába történő értékesítésére vonatkozó korlátozások további kihívásokat jelentenek, mivel a generatív modellek képzéséhez sok ilyen lapkára van szükség. Többek között a Baidu és a 01.AI azt nyilatkozta, hogy elegendő chipet halmoztak fel ahhoz, hogy a közeljövőben is fenntartsák működésüket. Az ország leginkább a számítógépes látás és az autonóm járművek terén jeleskedik, de néhány kínai vállalkozó más területeken elért áttörésekkel is szeretné az Egyesült Államokat megelőzni.
Wang Changhu, a ByteDance MI laboratóriumának korábbi vezetője tavaly alapította meg Pekingben az AIsphere nevű vállalatot, hogy a technológia következő nagy határterületét, a videógenerálást kutassa. Novemberben a startup kiadta a PixVerse-t, egy mesterséges intelligenciával működő generátort, amely képes videót készíteni egy szöveges leírásból. "Előreléptünk, a modelljeinket az alapoktól kezdve építettük fel" - mondta Wang. "Ez jelentős előnyt jelent számunkra, hiszen igazi úttörők vagyunk a videogenerálás területén." Ez az előny talán csak néhány hónapig tartott. A múlt héten az OpenAI bemutatta a Sora nevű mesterséges intelligencia eszközt, amely egy egyszerű szöveges felszólítást olyan videókká alakít, amelyek úgy néznek ki, mintha egy hollywoodi filmből lettek volna átemelve.