SG.hu
Az OpenAI nyílt modelleket adott ki, hogy ne a kínai DeepSeek tarolja le a piacot
Az OpenAI kiadta első nyílt mesterséges intelligencia modelljét a ChatGPT bevezetése óta. Az ingyenes és átlátható MI-rendszerek bevezetése eltérést jelent a társaság eddigi, előfizetésen alapuló zárt megközelítésétől. Nem jókedvükből tették: a 300 milliárd dollárra értékelt cég megpróbálja dominálni a kínai DeepSeek és mások által támasztott növekvő versenyt.
A San Franciscó-i székhelyű vállalat két „nyitott súlyú” modellt mutatott be, amelyek ingyenesen hozzáférhetők és a fejlesztők által testreszabhatók, így átláthatóbb alternatívát kínálnak a meglévő zárt MI-termékekhez képest. A modellek bevezetése hat hónappal azután történt, hogy a kínai DeepSeek januárban megdöbbentő eredményeket ért el az R1 nyílt modelljének bevezetésével, amely összehasonlítható volt az OpenAI egyes termékeivel, és aláásta a Szilícium-völgy vezető szerepét a globális MI-fegyverkezési versenyben. Az R1 bemutatását követő napokban az OpenAI vezérigazgatója, Sam Altman kijelentette, hogy szerinte vállalata „rossz oldalon állt a történelem során, és eltérő nyílt forráskódú stratégiát kell kidolgoznia”.
Az OpenAI új modelljei, az úgynevezett „gpt-oss” modellek ugyanolyan jól teljesítenek, mint a ChatGPT-t működtető kisebb zárt modellek, és „ügynöki munkafolyamatokban való használatra lettek tervezve”. Ez azt jelenti, hogy a rendszer autonóm módon működik, és komplex lekérdezések lépésről - lépésre történő feldolgozására lett betanítva. A fejlesztők emellett beállíthatják, hogy a modell mennyire összpontosítson a "következtetés-képtelenségre”, ahelyett, hogy gyorsan válaszolna.
Bár az új OpenAI modellek „nyitott súlyúak”, de nem „nyílt forráskódúak” - utóbbi átfogóbb információkat nyújt, beleértve az adatkészleteket és a modell nulláról történő betanításához szükséges kódot. A cég szerint teljesítményük összehasonlítható a vezető nyílt modellekkel, beleértve a kínaiakat is. Az OpenAI nem adott részleteket arról, hogyan szándékozik pénzzé tenni a nyílt terméket. "Az OpenAI küldetése az, hogy biztosítsa az egész emberiség számára előnyös általános mesterséges intelligenciát” – mondta Altman. "Ennek érdekében örülünk, ha a világ egy demokratikus értékeken alapuló, az Egyesült Államokban létrehozott nyílt MI-stackre építkezik, amely mindenki számára ingyenesen elérhető és széles körű előnyökkel jár.”
A DeepSeek és más kínai MI-rendszerek - köztük az Alibaba Qwen és a Moonshot Kimi - sikere segítette Kínát abban, hogy átvegye az Egyesült Államoktól a vezető szerepet a nyílt forráskódú MI-technológiában, és hatalmas keresletet váltott ki a fejlesztők körében. Az Egyesült Államokban a rivális Meta a nyílt súlyú modellek fejlesztésére összpontosított, de legújabb rendszere nem felelt meg az elvárásoknak. Az OpenAI nagyobb nyílt forráskódú modellje hasonlóan teljesít, mint zárt o4-mini modelljük, míg a kisebb verzió eredményei közel állnak az o3-mini rendszerhez. A kis modell kevesebb memóriát igényel a futtatáshoz, „így ideális eszközön belüli felhasználásra”, például telefonokon vagy laptopokon, közölte a vállalat.
A nyílt súlyú modelleket gyakran magasabb kockázatúnak tartják a zárt rendszereknél, mivel testreszabhatók, és hibás működésük esetén nem könnyű visszahívni őket. Az OpenAI kétszer is elhalasztotta a modellek megjelenését, melyek kiadása eredetileg júniusra volt tervezve. Júliusban Altman azt mondta, hogy a vállalatnak időre van szüksége „további biztonsági tesztek elvégzéséhez”.
Altman részletesen ismertetette, hogyan hozott létre egy olyan verziót a modellekből, amely szándékosan utánozza, hogyan használhatná egy rosszindulatú szereplő az új termékeket. Ezután tesztelték őket olyan sebezhetőségek szempontjából, amelyek lehetővé tehetik az MI visszaélésszerű használatát, például biológiai fegyverek tervezését vagy új vírusok létrehozását. A rosszindulatú modellek belső tesztjei során „nem tudtak magas teljesítményszintet elérni”, és három független szakértői csoport vizsgálta őket, amelyek javításokat javasoltak a teszteléshez – tette hozzá a vállalat.
A Meta vezérigazgatója, Mark Zuckerberg régóta hangos szószólója a nyitott MI ökoszisztémának. A múlt héten kiadott feljegyzésében azonban azt írta, hogy a Meta új kezdeményezése, amelynek célja az ember intelligenciáját meghaladó „szuperintelligens rendszerek” kifejlesztése, „új biztonsági aggályokat vet fel”, és hozzátette: „Rigorózusan kell eljárnunk ezeknek a kockázatoknak a csökkentése érdekében, és óvatosan kell kiválasztanunk, hogy mit teszünk nyílt forráskódúvá.”
A San Franciscó-i székhelyű vállalat két „nyitott súlyú” modellt mutatott be, amelyek ingyenesen hozzáférhetők és a fejlesztők által testreszabhatók, így átláthatóbb alternatívát kínálnak a meglévő zárt MI-termékekhez képest. A modellek bevezetése hat hónappal azután történt, hogy a kínai DeepSeek januárban megdöbbentő eredményeket ért el az R1 nyílt modelljének bevezetésével, amely összehasonlítható volt az OpenAI egyes termékeivel, és aláásta a Szilícium-völgy vezető szerepét a globális MI-fegyverkezési versenyben. Az R1 bemutatását követő napokban az OpenAI vezérigazgatója, Sam Altman kijelentette, hogy szerinte vállalata „rossz oldalon állt a történelem során, és eltérő nyílt forráskódú stratégiát kell kidolgoznia”.
Az OpenAI új modelljei, az úgynevezett „gpt-oss” modellek ugyanolyan jól teljesítenek, mint a ChatGPT-t működtető kisebb zárt modellek, és „ügynöki munkafolyamatokban való használatra lettek tervezve”. Ez azt jelenti, hogy a rendszer autonóm módon működik, és komplex lekérdezések lépésről - lépésre történő feldolgozására lett betanítva. A fejlesztők emellett beállíthatják, hogy a modell mennyire összpontosítson a "következtetés-képtelenségre”, ahelyett, hogy gyorsan válaszolna.
Bár az új OpenAI modellek „nyitott súlyúak”, de nem „nyílt forráskódúak” - utóbbi átfogóbb információkat nyújt, beleértve az adatkészleteket és a modell nulláról történő betanításához szükséges kódot. A cég szerint teljesítményük összehasonlítható a vezető nyílt modellekkel, beleértve a kínaiakat is. Az OpenAI nem adott részleteket arról, hogyan szándékozik pénzzé tenni a nyílt terméket. "Az OpenAI küldetése az, hogy biztosítsa az egész emberiség számára előnyös általános mesterséges intelligenciát” – mondta Altman. "Ennek érdekében örülünk, ha a világ egy demokratikus értékeken alapuló, az Egyesült Államokban létrehozott nyílt MI-stackre építkezik, amely mindenki számára ingyenesen elérhető és széles körű előnyökkel jár.”
A DeepSeek és más kínai MI-rendszerek - köztük az Alibaba Qwen és a Moonshot Kimi - sikere segítette Kínát abban, hogy átvegye az Egyesült Államoktól a vezető szerepet a nyílt forráskódú MI-technológiában, és hatalmas keresletet váltott ki a fejlesztők körében. Az Egyesült Államokban a rivális Meta a nyílt súlyú modellek fejlesztésére összpontosított, de legújabb rendszere nem felelt meg az elvárásoknak. Az OpenAI nagyobb nyílt forráskódú modellje hasonlóan teljesít, mint zárt o4-mini modelljük, míg a kisebb verzió eredményei közel állnak az o3-mini rendszerhez. A kis modell kevesebb memóriát igényel a futtatáshoz, „így ideális eszközön belüli felhasználásra”, például telefonokon vagy laptopokon, közölte a vállalat.
A nyílt súlyú modelleket gyakran magasabb kockázatúnak tartják a zárt rendszereknél, mivel testreszabhatók, és hibás működésük esetén nem könnyű visszahívni őket. Az OpenAI kétszer is elhalasztotta a modellek megjelenését, melyek kiadása eredetileg júniusra volt tervezve. Júliusban Altman azt mondta, hogy a vállalatnak időre van szüksége „további biztonsági tesztek elvégzéséhez”.
Altman részletesen ismertetette, hogyan hozott létre egy olyan verziót a modellekből, amely szándékosan utánozza, hogyan használhatná egy rosszindulatú szereplő az új termékeket. Ezután tesztelték őket olyan sebezhetőségek szempontjából, amelyek lehetővé tehetik az MI visszaélésszerű használatát, például biológiai fegyverek tervezését vagy új vírusok létrehozását. A rosszindulatú modellek belső tesztjei során „nem tudtak magas teljesítményszintet elérni”, és három független szakértői csoport vizsgálta őket, amelyek javításokat javasoltak a teszteléshez – tette hozzá a vállalat.
A Meta vezérigazgatója, Mark Zuckerberg régóta hangos szószólója a nyitott MI ökoszisztémának. A múlt héten kiadott feljegyzésében azonban azt írta, hogy a Meta új kezdeményezése, amelynek célja az ember intelligenciáját meghaladó „szuperintelligens rendszerek” kifejlesztése, „új biztonsági aggályokat vet fel”, és hozzátette: „Rigorózusan kell eljárnunk ezeknek a kockázatoknak a csökkentése érdekében, és óvatosan kell kiválasztanunk, hogy mit teszünk nyílt forráskódúvá.”