SG.hu
A Google köröket vert a riválisokra az új Geminivel
Elkészült Amerika következő topmodellje; a harmadik verzió kiadásával a Gemini nevű nagy nyelvi modell túlszárnyalta a ChatGPT-t és más versenytársakat, és a konszenzusos iparági benchmark tesztek alapján a legjobb MI-chatbottá vált.
Az eredmények nyilvános igazolást jelentenek a Google dolgozóinak, akik hónapok óta saját, személyes teszteket végeztek a modellen - például vicceket kértek tőle vagy bonyolult matematikai feladatokkal próbálták megfogni -, és arra jutottak, hogy végre van valami a kezükben, ami a vállalat javára billentheti a LLM-mezőnyt. Az egyik „vibe check” során Tulsee Doshi, a Gemini termékmenedzsmentért felelős vezető igazgatója megkérte a modellt, hogy írjon gudzsaráti nyelven, amelyet széles körben beszélnek Indiában, de az interneten nem különösebben elterjedt. Az eredmények sokkal jobbak voltak, mint amit korábbi modellektől kapott. „Én ezt életjelnek szoktam hívni” - mondta. „Az emberek odajöttek hozzám, és azt mondták: ’Azt hiszem, rátaláltunk valamire.’”
Aaron Levie, a Box nevű felhőalapú tartalomkezelő vállalat vezérigazgatója a megjelenés előtt néhány nappal korai hozzáférést kapott a Gemini 3-hoz. A cég ennek kapcsán saját értékeléseket futtatott le a modellen, hogy megvizsgálja, mennyire képes nagy mennyiségű, összetett dokumentum elemzésére. „Először hunyorognunk kellett, és azon gondolkodtunk: ’Valamit rosszul csináltunk a saját tesztünkben?’ mert az ugrás olyan nagy volt” - mondta. „De akárhányszor teszteltük, két számjegyű pontkülönbséggel végzett az élen.”
A Gemini 3 elindításával a Google egy nagyon nehezen megszerezhető győzelmet ért el. A cég évek óta először került messze az élre a mesterséges intelligencia fejlesztésének versenyében. A legújabb MI-modell pár nappal ezelőtti megjelenése lenyűgözte a felhasználókat, akik dicsérték intelligenciáját, pontosságát és kreatív képességeit. Csütörtökön a vállalat bejelentette, hogy a Gemini 3 fogja működtetni a Nano Banana új verzióját, egy népszerű képgeneráló eszközt, amely már eddig is gyorsan növelte a Gemini használatát. Az új modell sikere komoly kihívást jelent az OpenAI-nak, az Anthropicnak és más startupoknak, amelyek az MI dominanciájára törekednek. A Gemini 3 több mint egy tucat benchmark teszten teljesített jobban, amelyek a különféle intelligenciakategóriákat értékelték.
„Ők most az MI nyertesei, ez eléggé világos” - véli Michael Nathanson, a MoffettNathanson elemzője. „Elég jó érzéseim vannak most azzal kapcsolatban, hogy milyen lapok vannak a kezükben.” De az OpenAI ChatGPT-je még mindig messze a legnépszerűbb MI-chatbot. A vállalat közlése szerint jelenleg hetente 800 millió felhasználója van, szemben a Gemini havi 650 millió felhasználójával. Az Anthropic Claude-ja pedig széles körben úgy ismert, mint a kódolási feladatok egyik legjobb modellje. De a Gemini 3 előrelépései potenciálisan azt eredményezhetik, hogy a modell sokféle feladatra válik a preferált eszközzé - mondják szakértők és elemzők.
A Google három éve, a ChatGPT megjelenése óta igyekszik előnyre szert tenni az MI-versenyben, amely felkorbácsolta a befektetők félelmeit, hogy a vállalat ikonikus keresőmotorja jelentős forgalmat veszíthet más chatbotokkal szemben. A cég hónapokig küzdött, hogy lendületet nyerjen. Sundar Pichai vezérigazgató és más vezetők azóta dolgoztak azon, hogy átalakítsák a vállalat MI-fejlesztési stratégiáját: lebontották a részlegek közötti határokat, egyszerűsítették a vezetést és összevonták a modellfejlesztési munkákat - állítják a dolgozók. Sergey Brin, a Google egyik társalapítója is visszatért a vállalathoz napi szintű szerepbe, hogy segítse az MI-fejlesztési erőfeszítések felügyeletét.
A vállalat májusi éves fejlesztői konferenciáján egy sor kifinomult MI-terméket mutatott be, valamint a klasszikus keresőmotor egy felújított verzióját egy olyan MI funkcióval, amely a keresési lekérdezésekre chatbot-szerű beszélgetésben válaszol. Nathanson szerint ez segített néhány befektetőnek visszanyerni a bizalmat, hogy a cég visszatérésre készül, de a részvényárfolyam még mindig alacsony volt a nyáron. „A Wall Street azon vitatkozott, hogy vajon bedarálja-e őket az MI” - mondta.
Aztán augusztusban a Nano Banana debütálása rekordsebességre pörgette fel a Gemini használatát. A Gemini havi felhasználószáma július óta 450 millióról 650 millióra nőtt. A cég szeptemberben is fontos győzelmet könyvelhetett el, amikor egy szövetségi bíró úgy döntött, nem vet ki szigorú büntetéseket a vállalatra, miután korábban megállapította, hogy az illegális monopóliumot tart fenn a keresési piacon. A bíró szerint a piaci versenyhelyzet már most változik, főként az MI miatt. A Google anyavállalata, az Alphabet, a múlt hónapban rekord negyedéves bevételt jelentett, elsősorban a felhőszolgáltatások és a hirdetések mennyiségének növekedése miatt. Részvényei több mint 50 százalékkal emelkedtek idén, és több mint 60 százalékkal a nyár óta. A vállalat piaci értéke a múlt héten elérte a 3,6 billió dollárt, ezzel hét év után először megelőzve a Microsoftot.
A Google a Gemini 3-at úgy akarta fejleszteni, hogy az sikeres legyen a mesterséges intelligencia legnehezebb területein. A vállalat mérnökei és kutatói javítani akarták a modell képességét arra, hogy „lásson”, és mindenféle tartalmat elemezni és generálni tudjon - szöveget, képeket, hangot, videót és kódot. Emellett javítani akarták a gondolkodási és következtetési képességeit, hogy jobb személyi asszisztens legyen kódolásban és más feladatokban. A Gemini 3 húsz benchmark teszten elért pontszámai visszaigazolták a munkát. A modell lényegesen jobban teljesít a ChatGPT és az Anthropic legújabb verzióinál olyan teszteken, amelyek szakértői szintű tudást, logikai feladványokat, matematikai problémákat és képfelismerést mértek. Egyetlen teszten lett második - az Anthropic Claude Sonnet 4.5 mögött -, amely a kódolást vizsgálta.
A Google néhány tesztet házon belül végzett, a többit más cégek. A dolgozók a megjelenés előtti hétvégét azzal töltötték, hogy várták a visszaérkező eredményeket, amelyek közül néhány jóval magasabb volt a vártnál. Doshi azt mondta, a legjobb meglepetés a Gemini 3 Vending Bench nevű értékelésben elért magas pontszáma volt, amelyben a modelleknek egy termékárusító automatát kell működtetnie. A modellnek követnie kell a készletet, rendeléseket kell leadnia és árakat kell meghatároznia, hogy pénzt keressen a szimulációban. „A Vending Bench tükrözi azt, amiben reméltük, hogy ezzel a modellel előreléphetünk, vagyis a jobb eszközhasználatot és a jobb tervezést” - mondta.
A bevezetés után ez volt az első alkalom, hogy a vállalat egy új modellt már a megjelenés napján beépített a keresésbe. A vállalat tervei szerint hamarosan minden felhasználó számára elérhetővé teszik. Robby Stein keresési termékekért felelős alelnök hónapokig dolgozott a Gemini csapatával azon, hogyan javíthatná az új modell a keresési eredmények megjelenítését. Az egyik vibe check során abban kért segítséget, hogy elmagyarázza 7 éves fiának a felhajtóerő fogalmát egy repülőgépen. Írott választ várt. Az eredmény egy interaktív szimuláció lett, amelyben látható volt a szárny fölött áramló levegő, csúszkával változtathatta a szárny pozícióját és az áramlatokat, és felemelhette a repülőt a levegőbe. „Azt gondoltam: ’Hű, ez tényleg képes lehet arra, hogy a kérdésnek megfelelő legjobb módon jelenítsen meg információt’” - mondta. „Ez volt számomra a fő aha-pillanat ezzel a termékkel.”
Az eredmények nyilvános igazolást jelentenek a Google dolgozóinak, akik hónapok óta saját, személyes teszteket végeztek a modellen - például vicceket kértek tőle vagy bonyolult matematikai feladatokkal próbálták megfogni -, és arra jutottak, hogy végre van valami a kezükben, ami a vállalat javára billentheti a LLM-mezőnyt. Az egyik „vibe check” során Tulsee Doshi, a Gemini termékmenedzsmentért felelős vezető igazgatója megkérte a modellt, hogy írjon gudzsaráti nyelven, amelyet széles körben beszélnek Indiában, de az interneten nem különösebben elterjedt. Az eredmények sokkal jobbak voltak, mint amit korábbi modellektől kapott. „Én ezt életjelnek szoktam hívni” - mondta. „Az emberek odajöttek hozzám, és azt mondták: ’Azt hiszem, rátaláltunk valamire.’”
Aaron Levie, a Box nevű felhőalapú tartalomkezelő vállalat vezérigazgatója a megjelenés előtt néhány nappal korai hozzáférést kapott a Gemini 3-hoz. A cég ennek kapcsán saját értékeléseket futtatott le a modellen, hogy megvizsgálja, mennyire képes nagy mennyiségű, összetett dokumentum elemzésére. „Először hunyorognunk kellett, és azon gondolkodtunk: ’Valamit rosszul csináltunk a saját tesztünkben?’ mert az ugrás olyan nagy volt” - mondta. „De akárhányszor teszteltük, két számjegyű pontkülönbséggel végzett az élen.”
A Gemini 3 elindításával a Google egy nagyon nehezen megszerezhető győzelmet ért el. A cég évek óta először került messze az élre a mesterséges intelligencia fejlesztésének versenyében. A legújabb MI-modell pár nappal ezelőtti megjelenése lenyűgözte a felhasználókat, akik dicsérték intelligenciáját, pontosságát és kreatív képességeit. Csütörtökön a vállalat bejelentette, hogy a Gemini 3 fogja működtetni a Nano Banana új verzióját, egy népszerű képgeneráló eszközt, amely már eddig is gyorsan növelte a Gemini használatát. Az új modell sikere komoly kihívást jelent az OpenAI-nak, az Anthropicnak és más startupoknak, amelyek az MI dominanciájára törekednek. A Gemini 3 több mint egy tucat benchmark teszten teljesített jobban, amelyek a különféle intelligenciakategóriákat értékelték.
„Ők most az MI nyertesei, ez eléggé világos” - véli Michael Nathanson, a MoffettNathanson elemzője. „Elég jó érzéseim vannak most azzal kapcsolatban, hogy milyen lapok vannak a kezükben.” De az OpenAI ChatGPT-je még mindig messze a legnépszerűbb MI-chatbot. A vállalat közlése szerint jelenleg hetente 800 millió felhasználója van, szemben a Gemini havi 650 millió felhasználójával. Az Anthropic Claude-ja pedig széles körben úgy ismert, mint a kódolási feladatok egyik legjobb modellje. De a Gemini 3 előrelépései potenciálisan azt eredményezhetik, hogy a modell sokféle feladatra válik a preferált eszközzé - mondják szakértők és elemzők.
A Google három éve, a ChatGPT megjelenése óta igyekszik előnyre szert tenni az MI-versenyben, amely felkorbácsolta a befektetők félelmeit, hogy a vállalat ikonikus keresőmotorja jelentős forgalmat veszíthet más chatbotokkal szemben. A cég hónapokig küzdött, hogy lendületet nyerjen. Sundar Pichai vezérigazgató és más vezetők azóta dolgoztak azon, hogy átalakítsák a vállalat MI-fejlesztési stratégiáját: lebontották a részlegek közötti határokat, egyszerűsítették a vezetést és összevonták a modellfejlesztési munkákat - állítják a dolgozók. Sergey Brin, a Google egyik társalapítója is visszatért a vállalathoz napi szintű szerepbe, hogy segítse az MI-fejlesztési erőfeszítések felügyeletét.
A vállalat májusi éves fejlesztői konferenciáján egy sor kifinomult MI-terméket mutatott be, valamint a klasszikus keresőmotor egy felújított verzióját egy olyan MI funkcióval, amely a keresési lekérdezésekre chatbot-szerű beszélgetésben válaszol. Nathanson szerint ez segített néhány befektetőnek visszanyerni a bizalmat, hogy a cég visszatérésre készül, de a részvényárfolyam még mindig alacsony volt a nyáron. „A Wall Street azon vitatkozott, hogy vajon bedarálja-e őket az MI” - mondta.
Aztán augusztusban a Nano Banana debütálása rekordsebességre pörgette fel a Gemini használatát. A Gemini havi felhasználószáma július óta 450 millióról 650 millióra nőtt. A cég szeptemberben is fontos győzelmet könyvelhetett el, amikor egy szövetségi bíró úgy döntött, nem vet ki szigorú büntetéseket a vállalatra, miután korábban megállapította, hogy az illegális monopóliumot tart fenn a keresési piacon. A bíró szerint a piaci versenyhelyzet már most változik, főként az MI miatt. A Google anyavállalata, az Alphabet, a múlt hónapban rekord negyedéves bevételt jelentett, elsősorban a felhőszolgáltatások és a hirdetések mennyiségének növekedése miatt. Részvényei több mint 50 százalékkal emelkedtek idén, és több mint 60 százalékkal a nyár óta. A vállalat piaci értéke a múlt héten elérte a 3,6 billió dollárt, ezzel hét év után először megelőzve a Microsoftot.
A Google a Gemini 3-at úgy akarta fejleszteni, hogy az sikeres legyen a mesterséges intelligencia legnehezebb területein. A vállalat mérnökei és kutatói javítani akarták a modell képességét arra, hogy „lásson”, és mindenféle tartalmat elemezni és generálni tudjon - szöveget, képeket, hangot, videót és kódot. Emellett javítani akarták a gondolkodási és következtetési képességeit, hogy jobb személyi asszisztens legyen kódolásban és más feladatokban. A Gemini 3 húsz benchmark teszten elért pontszámai visszaigazolták a munkát. A modell lényegesen jobban teljesít a ChatGPT és az Anthropic legújabb verzióinál olyan teszteken, amelyek szakértői szintű tudást, logikai feladványokat, matematikai problémákat és képfelismerést mértek. Egyetlen teszten lett második - az Anthropic Claude Sonnet 4.5 mögött -, amely a kódolást vizsgálta.
A Google néhány tesztet házon belül végzett, a többit más cégek. A dolgozók a megjelenés előtti hétvégét azzal töltötték, hogy várták a visszaérkező eredményeket, amelyek közül néhány jóval magasabb volt a vártnál. Doshi azt mondta, a legjobb meglepetés a Gemini 3 Vending Bench nevű értékelésben elért magas pontszáma volt, amelyben a modelleknek egy termékárusító automatát kell működtetnie. A modellnek követnie kell a készletet, rendeléseket kell leadnia és árakat kell meghatároznia, hogy pénzt keressen a szimulációban. „A Vending Bench tükrözi azt, amiben reméltük, hogy ezzel a modellel előreléphetünk, vagyis a jobb eszközhasználatot és a jobb tervezést” - mondta.
A bevezetés után ez volt az első alkalom, hogy a vállalat egy új modellt már a megjelenés napján beépített a keresésbe. A vállalat tervei szerint hamarosan minden felhasználó számára elérhetővé teszik. Robby Stein keresési termékekért felelős alelnök hónapokig dolgozott a Gemini csapatával azon, hogyan javíthatná az új modell a keresési eredmények megjelenítését. Az egyik vibe check során abban kért segítséget, hogy elmagyarázza 7 éves fiának a felhajtóerő fogalmát egy repülőgépen. Írott választ várt. Az eredmény egy interaktív szimuláció lett, amelyben látható volt a szárny fölött áramló levegő, csúszkával változtathatta a szárny pozícióját és az áramlatokat, és felemelhette a repülőt a levegőbe. „Azt gondoltam: ’Hű, ez tényleg képes lehet arra, hogy a kérdésnek megfelelő legjobb módon jelenítsen meg információt’” - mondta. „Ez volt számomra a fő aha-pillanat ezzel a termékkel.”