Elon Musk MI-startupja, az xAI bemutatta a Grok-3-at

Elon Musk AI cége, az xAI hétfőn késő este kiadta legújabb MI zászlóshajó modelljét, a Grok 3-at, és új képességeket mutatott be a Grok iOS és webes alkalmazásaihoz.

A Grok, az xAI válasza az olyan modellekre, mint az OpenAI GPT-4o és a Google Gemini: képes képeket elemezni és kérdésekre válaszolni, és számos funkciót működtet Musk közösségi hálózatán, az X-en. A Grok 3 több hónapja fejlesztés alatt állt, és már tavaly ki akarták adni, de a vártnál nagyobb falatnak bizonyult. Az xAI egy hatalmas, mintegy 200 000 GPU-t tartalmazó memphisi adatközpontot használt a Grok 3 betanításához. A Grok 3 egy modellcsalád; a kisebb változat, a Grok 3 mini gyorsabban válaszol a kérdésekre, némi pontosság rovására. A Grok 3 összes modellje és kapcsolódó funkciója még nem érhető el (néhány még béta verzióban van).

Az X-en közzétett posztjában Musk azt állítja, hogy a Grok 3-at tízszer vagy még nagyobb számítási kapacitással fejlesztették ki, mint elődjét, a Grok 2-t, egy kibővített képzési készletet használva, amely bírósági ügyek aktáit is tartalmazza. "A Grok 3 egy nagyságrenddel nagyobb teljesítményű, mint a Grok 2” - mondta Musk egy hétfőn élőben közvetített prezentáció során. "Ez egy maximálisan igazságkereső mesterséges intelligencia, még akkor is, ha ez az igazság néha ellentétes azzal, ami politikailag korrekt”.

Az xAI azt állítja, hogy a Grok 3 megveri benchmarkokban a GPT-4o-t , beleértve az AIME-t (amely egy modell teljesítményét értékeli matematikai kérdésekből álló mintavételen) és a GPQA-t (amely a modelleket PhD-szintű fizikai, biológiai és kémiai problémák alapján értékeli). Az xAI szerint a Grok 3 korai változata a Chatbot Arena nevű tömeges tesztelésen is versenyképes eredményt ért el, amely különböző mesterséges intelligencia modelleket állít egymással szembe, és a felhasználók szavaznak a preferált válaszokra.

Az új Grok 3 család két modellje, a Grok 3 Reasoning és a Grok 3 mini Reasoning végiggondolja” a problémákat, hasonlóan az olyan „érvelő” modellekhez, mint az OpenAI o3-mini és a kínai DeepSeek vállalat R1 modellje. Az érvelő modellek megpróbálják ellenőrizni magukat, mielőtt eredményeket dobnának ki, ami segít elkerülni néhány olyan buktatót, amelyek általában megfektetik a modelleket. Az xAI azt állítja, hogy a Grok 3 Reasoning több népszerű benchmarkon, köztük az AIME 2025 nevű újabb matematikai benchmarkon is felülmúlja az o3-mini legjobb változatát, az o3-mini-high-t.

Az érvelési modellek a Grok alkalmazáson keresztül érhetők el. A felhasználók megkérhetik a Grok 3-at, hogy „gondolkodjon”, vagy - nehezebb kérdések esetén - a „Big Brain” üzemmódot használhatják a további számításokat alkalmazó érveléshez. Az xAI leírása szerint az érvelési modellek a leginkább matematikai, természettudományos és programozási kérdésekhez alkalmasak. Musk elmondta, hogy a Grok alkalmazásban az érvelő modellek „gondolatai” némelyikét elrejtik, hogy megakadályozzák a desztillációt, egy olyan módszert, amelyet a mesterséges intelligencia modellek fejlesztői használnak arra, hogy más modellekből tudást vonjanak ki. Nemrégiben a DeepSeek-et azzal vádolták, hogy az OpenAI modelljeit desztillálja, hogy saját modelleket hozzon létre.

GROK 3: SOLVING PHYSICS, GAMES, AND THE UNIVERSE

Full presentation and demo of xAI's latest model

0:00 xAI's mission: Understand the universe
1:20 Team presentation
2:01 Grok means to profoundly understand
2:29 From Grok 2 to Grok 3
6:30 Grok 3 benchmarks
9:07 Grok 3 improves… https://t.co/7qbB6O16Yb pic.twitter.com/BomGwAOa1I
— Mario Nawfal (@MarioNawfal) February 18, 2025

A Grok érvelési modelljei a Grok alkalmazás DeepSearch nevű új funkciójának alapját képezik, amely az xAI válasza az olyan mesterséges intelligencia alapú kutatási eszközökre, mint az OpenAI Deep Research. A DeepSearch az internetet és az X-et pásztázza, hogy elemezze az információkat, és egy kérdésre válaszul összefoglalót adjon. Az X prémium+ szintjére (50 dollár havonta) előfizetők először a Grok 3-hoz kapnak hozzáférést, a többi funkció pedig egy új szintre kerül, amelyet az xAI SuperGroknak nevez. A SuperGrok havi 30 dolláros vagy évi 300 dolláros áron (ha hinni lehet a kiszivárgott információknak) további következtetéseket és DeepSearch-lekérdezéseket tesz lehetővé, és korlátlan képgenerálást is kínál.

A jövőben - körülbelül egy hét múlva - a Grok alkalmazás „hangmódot” kap, mondta Musk, ami szintetizált hangot ad a Grok modelleknek. Néhány héttel ezután a Grok 3 modellek az xAI vállalati API-ján keresztül lesznek elérhetők, a DeepSearch képességgel együtt. Az xAI a következő hónapokban tervezi a Grok 2 nyílt forráskódúvá tételét, mondta Musk. "Az általános megközelítésünk az, hogy az utolsó Grok verziót akkor fogjuk nyílt forráskódúvá tenni, amikor a következő verzió már teljesen kész” - folytatta. "Amikor a Grok 3 kiforrott és stabil lesz - ami valószínűleg néhány hónapon belül bekövetkezik -, akkor fogjuk nyílt forráskódúvá tenni a Grok 2-t.”

Amikor Musk nagyjából két évvel ezelőtt bejelentette a Grokot, az MI-modellt nyers, anti-„woke” modellnek állította be; azaz amely hajlandó megválaszolni olyan ellentmondásos kérdéseket, amelyekre más MI-rendszerek nem hajlandók. Ezt az ígéretét részben be is váltotta: ha például arra utasítják, hogy legyen vulgáris, a Grok és a Grok 2 boldogan teljesítette a kérést, és olyan színes nyelvezetet használt, amelyet valószínűleg soha nem adna válaszként a ChatGPT. A Grok 3 előtti Grok modellek azonban politikai témákról nem beszéltek, és nem léptek át bizonyos határokat.

Egy tanulmány szerint a Grok a politikai baloldal felé hajlott olyan témákban, mint a transzneműek jogai, a sokszínűségi programok és az egyenlőtlenség. Musk a Grok képzési adatait - nyilvános weboldalakat - okolta a viselkedésért, és ígéretet tett arra, hogy „közelebb hozza a Grokot a politikailag semleges irányba”. Egyelőre nem világos, hogy az xAI elérte-e ezt a célt, és milyen következményei lehetnek.

Elon Musk MI-startupja, az xAI bemutatta a Grok-3-at

Kapcsolódó cikkek és linkek

Hozzászólások