SG.hu

A Google köröket vert a riválisokra az új Geminivel

Elkészült Amerika következő topmodellje; a harmadik verzió kiadásával a Gemini nevű nagy nyelvi modell túlszárnyalta a ChatGPT-t és más versenytársakat, és a konszenzusos iparági benchmark tesztek alapján a legjobb MI-chatbottá vált.

Az eredmények nyilvános igazolást jelentenek a Google dolgozóinak, akik hónapok óta saját, személyes teszteket végeztek a modellen - például vicceket kértek tőle vagy bonyolult matematikai feladatokkal próbálták megfogni -, és arra jutottak, hogy végre van valami a kezükben, ami a vállalat javára billentheti a LLM-mezőnyt. Az egyik „vibe check” során Tulsee Doshi, a Gemini termékmenedzsmentért felelős vezető igazgatója megkérte a modellt, hogy írjon gudzsaráti nyelven, amelyet széles körben beszélnek Indiában, de az interneten nem különösebben elterjedt. Az eredmények sokkal jobbak voltak, mint amit korábbi modellektől kapott. „Én ezt életjelnek szoktam hívni” - mondta. „Az emberek odajöttek hozzám, és azt mondták: ’Azt hiszem, rátaláltunk valamire.’”

Aaron Levie, a Box nevű felhőalapú tartalomkezelő vállalat vezérigazgatója a megjelenés előtt néhány nappal korai hozzáférést kapott a Gemini 3-hoz. A cég ennek kapcsán saját értékeléseket futtatott le a modellen, hogy megvizsgálja, mennyire képes nagy mennyiségű, összetett dokumentum elemzésére. „Először hunyorognunk kellett, és azon gondolkodtunk: ’Valamit rosszul csináltunk a saját tesztünkben?’ mert az ugrás olyan nagy volt” - mondta. „De akárhányszor teszteltük, két számjegyű pontkülönbséggel végzett az élen.”

A Gemini 3 elindításával a Google egy nagyon nehezen megszerezhető győzelmet ért el. A cég évek óta először került messze az élre a mesterséges intelligencia fejlesztésének versenyében. A legújabb MI-modell pár nappal ezelőtti megjelenése lenyűgözte a felhasználókat, akik dicsérték intelligenciáját, pontosságát és kreatív képességeit. Csütörtökön a vállalat bejelentette, hogy a Gemini 3 fogja működtetni a Nano Banana új verzióját, egy népszerű képgeneráló eszközt, amely már eddig is gyorsan növelte a Gemini használatát. Az új modell sikere komoly kihívást jelent az OpenAI-nak, az Anthropicnak és más startupoknak, amelyek az MI dominanciájára törekednek. A Gemini 3 több mint egy tucat benchmark teszten teljesített jobban, amelyek a különféle intelligenciakategóriákat értékelték.

„Ők most az MI nyertesei, ez eléggé világos” - véli Michael Nathanson, a MoffettNathanson elemzője. „Elég jó érzéseim vannak most azzal kapcsolatban, hogy milyen lapok vannak a kezükben.” De az OpenAI ChatGPT-je még mindig messze a legnépszerűbb MI-chatbot. A vállalat közlése szerint jelenleg hetente 800 millió felhasználója van, szemben a Gemini havi 650 millió felhasználójával. Az Anthropic Claude-ja pedig széles körben úgy ismert, mint a kódolási feladatok egyik legjobb modellje. De a Gemini 3 előrelépései potenciálisan azt eredményezhetik, hogy a modell sokféle feladatra válik a preferált eszközzé - mondják szakértők és elemzők.


A Google három éve, a ChatGPT megjelenése óta igyekszik előnyre szert tenni az MI-versenyben, amely felkorbácsolta a befektetők félelmeit, hogy a vállalat ikonikus keresőmotorja jelentős forgalmat veszíthet más chatbotokkal szemben. A cég hónapokig küzdött, hogy lendületet nyerjen. Sundar Pichai vezérigazgató és más vezetők azóta dolgoztak azon, hogy átalakítsák a vállalat MI-fejlesztési stratégiáját: lebontották a részlegek közötti határokat, egyszerűsítették a vezetést és összevonták a modellfejlesztési munkákat - állítják a dolgozók. Sergey Brin, a Google egyik társalapítója is visszatért a vállalathoz napi szintű szerepbe, hogy segítse az MI-fejlesztési erőfeszítések felügyeletét.

A vállalat májusi éves fejlesztői konferenciáján egy sor kifinomult MI-terméket mutatott be, valamint a klasszikus keresőmotor egy felújított verzióját egy olyan MI funkcióval, amely a keresési lekérdezésekre chatbot-szerű beszélgetésben válaszol. Nathanson szerint ez segített néhány befektetőnek visszanyerni a bizalmat, hogy a cég visszatérésre készül, de a részvényárfolyam még mindig alacsony volt a nyáron. „A Wall Street azon vitatkozott, hogy vajon bedarálja-e őket az MI” - mondta.

Aztán augusztusban a Nano Banana debütálása rekordsebességre pörgette fel a Gemini használatát. A Gemini havi felhasználószáma július óta 450 millióról 650 millióra nőtt. A cég szeptemberben is fontos győzelmet könyvelhetett el, amikor egy szövetségi bíró úgy döntött, nem vet ki szigorú büntetéseket a vállalatra, miután korábban megállapította, hogy az illegális monopóliumot tart fenn a keresési piacon. A bíró szerint a piaci versenyhelyzet már most változik, főként az MI miatt. A Google anyavállalata, az Alphabet, a múlt hónapban rekord negyedéves bevételt jelentett, elsősorban a felhőszolgáltatások és a hirdetések mennyiségének növekedése miatt. Részvényei több mint 50 százalékkal emelkedtek idén, és több mint 60 százalékkal a nyár óta. A vállalat piaci értéke a múlt héten elérte a 3,6 billió dollárt, ezzel hét év után először megelőzve a Microsoftot.


A Google a Gemini 3-at úgy akarta fejleszteni, hogy az sikeres legyen a mesterséges intelligencia legnehezebb területein. A vállalat mérnökei és kutatói javítani akarták a modell képességét arra, hogy „lásson”, és mindenféle tartalmat elemezni és generálni tudjon - szöveget, képeket, hangot, videót és kódot. Emellett javítani akarták a gondolkodási és következtetési képességeit, hogy jobb személyi asszisztens legyen kódolásban és más feladatokban. A Gemini 3 húsz benchmark teszten elért pontszámai visszaigazolták a munkát. A modell lényegesen jobban teljesít a ChatGPT és az Anthropic legújabb verzióinál olyan teszteken, amelyek szakértői szintű tudást, logikai feladványokat, matematikai problémákat és képfelismerést mértek. Egyetlen teszten lett második - az Anthropic Claude Sonnet 4.5 mögött -, amely a kódolást vizsgálta.

A Google néhány tesztet házon belül végzett, a többit más cégek. A dolgozók a megjelenés előtti hétvégét azzal töltötték, hogy várták a visszaérkező eredményeket, amelyek közül néhány jóval magasabb volt a vártnál. Doshi azt mondta, a legjobb meglepetés a Gemini 3 Vending Bench nevű értékelésben elért magas pontszáma volt, amelyben a modelleknek egy termékárusító automatát kell működtetnie. A modellnek követnie kell a készletet, rendeléseket kell leadnia és árakat kell meghatároznia, hogy pénzt keressen a szimulációban. „A Vending Bench tükrözi azt, amiben reméltük, hogy ezzel a modellel előreléphetünk, vagyis a jobb eszközhasználatot és a jobb tervezést” - mondta.

A bevezetés után ez volt az első alkalom, hogy a vállalat egy új modellt már a megjelenés napján beépített a keresésbe. A vállalat tervei szerint hamarosan minden felhasználó számára elérhetővé teszik. Robby Stein keresési termékekért felelős alelnök hónapokig dolgozott a Gemini csapatával azon, hogyan javíthatná az új modell a keresési eredmények megjelenítését. Az egyik vibe check során abban kért segítséget, hogy elmagyarázza 7 éves fiának a felhajtóerő fogalmát egy repülőgépen. Írott választ várt. Az eredmény egy interaktív szimuláció lett, amelyben látható volt a szárny fölött áramló levegő, csúszkával változtathatta a szárny pozícióját és az áramlatokat, és felemelhette a repülőt a levegőbe. „Azt gondoltam: ’Hű, ez tényleg képes lehet arra, hogy a kérdésnek megfelelő legjobb módon jelenítsen meg információt’” - mondta. „Ez volt számomra a fő aha-pillanat ezzel a termékkel.”

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • militavia #17
    Semmi titkos nincs abban, amit kérdeztem...
    Jelenleg a corporate BS arról szól, hogy KREATÍV feladatokat is az AI old meg. Nem "majd".

    Ehhez képest vicces a történet, amikor valami cég kirúgta valami 90 emberét - assem - , az AI szart sem ért, majd könyörögni kezdett volt alkalmazottainak, hogy akkor menjenek vissza. És nem kreatív, valami mezei ügyfélszolis volt asszem.

    Na ennyit erről a fantasztikus "AI-ról".
    Utoljára szerkesztette: militavia, 2025.11.25. 20:46:39
  • repvez #16
    azért az érdekes, hogy nálad mindig minden elhasal. DE az nem derül ki ,hogy ez miben merül ki. Meg ahogy a neve is mutatja Általános nagy nyelvi model. Nem sofisztikált katonai harcászati fegyverzeti speciális nyelvi modell. A legtöbb ilyen adat titkos ,nem nyilvánosan hozzáférhető informácio a nyelvi modellek csak nyilt és kereshető filokbol adatokbol dolgozhatnak és azokhoz férnek hozzá.
    És ha tudod amit kérdezni akarsz és nem jol válaszol akkor miért kérdezed?Mi a célod vele? a legtöbb ember azért kérdez mert nem tud rola szinte semmit és kér egy irány mutatást vagy egy folyamatot , hogy milyen irányba induljon el megtalálni azt ami a valos és jo eredmény.
    Ugyen ezek a promtozás, hogy ugy tedd fel a kérdest , hogy arra kielégitő választ adjon ami alapján már egy google keresést rá tudsz inditani és onnan elindulni.
    Egyébként meg van már több nyelvi model ha az egyik nem jön be ott a másik. Vagy ha anynira fontos a használat akkor fizess elő és akkor pontosabb találatot kaphatsz , korlátlanul esetleg később fog elfáradni halucinálni.
    Vannak olyan nyelvi modellek aminél PDF vagy bármilyen dokumentumot fel lehet tölteni és azon tréningel és igy tudsz saját tudásu AI-t létrehozni ami jobban képbe lesz a katonai dolgokba.

    Ne azt várd, hoyg majd helyetted gondolkodik és kitalálja , hogy te mire gondoltál mit akarsz vele kezdeni , nem fogja tovább gondolni a te egymondatos kérdésed és doktori disszertáciová bőviteni.
  • militavia #15
    Én tényleg csak ötletszerűen próbáltam használni, nem feszegetni a határokat, kb. ez volt teszt jellegű, de elbuktak. Lásd a legegyszerűbbet, egy "éle-e még XY" kérdésen is elhasalt. Ezért én már nem is használom fordításon kívül semmire. Persze ott is vastagon át kell írni sokszor, amit összehoz. A gépelési időt spórolja meg, meg esetleg néha szebb fordulát ad ki annak, mint amit én írnék. néha meg pont nem.
    Utoljára szerkesztette: militavia, 2025.11.25. 16:43:58
  • Celeborn #14
    Viszont az ilyen félaktív radar rendszereknél a CW radar-t csak arra használják, hogy a rakéta tudja, milyen szögben van a cél. A cél távolságát impulzusos radarral határozzák meg. Azt hiszem... Nem vágom a témát, szóval bocs, ha hülyeséget beszélek.
    Egyébként félreértés ne essék, én nem akarok senkit meggyőzni arról, hogy az AI tökéletes, mert tudom, hogy nem az. Én magam egyébként használom (informatikusként), de inkább iránymutatásnak. Mond valamit ami alapján el tudok indulni a nyomozásommal. Néha nagyon nagy baromságokat tud tud mondani, de sokszor nagyon jól rá tud mutatni az irányra. Ráadásul egyre jobbak a válaszai.
  • militavia #13
    Nem. Sima CW lokátorra, mint pl. az Sz-200-é vagy a HAWK-é. Első körben legalább a lokátor 2x2-őt tudja-e az LLM.
    Nem tudja... Hiszen semmit sem tud/ért. És ez még relatíve könnyen elérhető valami.

    Na képzeld el, ha ennél specifikusabb dolgok kérek és én tudom a választ. Orbitális faszásgokat dobál az összes LLM, amit szembejön és ingyért kipróbálhatod. És erre hivatkozva építettek le, meg terveznek leépíteni egyes meg nem értett zsenik és mánágerek... Meg erőltetik a használatát. Kb. annyi értelme van az esetek 99%-ban, mint mész helyett szarral vakolni.
    Utoljára szerkesztette: militavia, 2025.11.25. 13:15:14
  • militavia #12
    Ez a "valakinek" fizikai képtelenség. Ennyi erőforrás és szakértelem a világon nincs. Meg nem is értelmezhető ez, az LLM nem egy adatbázis. Pont ezért nem tud pontos választ adni. Kap egy inputot és a neten levő MINDEN elérhető valamiből - aminek egy részét vagy ignorálja az LLM vagy nem - ad egy outputot.

    Nagyon köznapi nyelven egy statisztikai tippelőgép, ami még képes hallucinálni is és ragaszkodni a hülyeséghez.
  • felemelő #11
    Valakinek súlyoznia és igazságtartam szerint (valamint aktualitás szerint is, pl. programozási kérdések) osztályozni kellene a forrásokat.
    De ez olyan sok költség és munka, hogy inkább hagyják, hogy a spam tartalom menjen be, és csodálkoznak ha spam tartalom jön ki.

    Pedig az ősi programozó bölcselet....
  • Celeborn #10
    akkor Te nem a MIMO CW radarra gondolsz?
  • militavia #9
    NEM.

    A CW lokátor egy ESZKÖZ. Az eszköz alkalmas arra, csak modulálni kell a jelet. Tehát jól tettem fel a kérdést. Nem a tiszta CW hullámot kérdeztem. Szóval köszönöm, ismét csak bizonyítva látom, hogy az AI segghülye. Mert valójában nem ért semmit. Nem érti a fogalmakat.

    Statisztikai alapon tippelgetve ad válaszokat. Erre bízni bármit jelen állapotban kreténség.
  • Celeborn #8
    Akkor rosszul tetted fel a kérdést. Mivel azt kérdezted, hogy a CW-vel hogyan lehet távolságot mérni, és erre a válasz az, hogy nem lehet. Ez tény. Frekvencia modulációval lehet, de nem ezt kérdezted. Egyébként a ChatGPT és a Gemini is leírta, hogy folytonos hullámmal nem lehet, de frekvencia modulációval (FMCW) igen.