SG.hu·
A Gemininek köszönhetően megnyerheti az MI-háborút a Google

Három évvel azután, hogy a ChatGPT felkészületlenül érte, a Google mindent biztosított magának ahhoz, hogy legyőzze az OpenAI-t és mindenki mást. A Gemini modell, a saját chipek és a globális terjesztés együtt olyan előnyt adnak a cégnek, amelyet nehéz utolérni, ráadásul az Apple Siri és a kereső integrációja új szintre emelheti a cég MI-modelljeinek elérését és adatbázisát.
Ha az MI-ben nyerni akarsz, és itt a legnagyobb, legjövedelmezőbb, a világot a saját képedre formáló értelemben vett győzelemről van szó, akkor egyszerre kell sok nehéz dolgot megcsinálnod. Olyan modellel kell rendelkezned, amely vitathatatlanul a piac legjobbjai közé tartozik. Szükséged van azokra a szinte végtelen erőforrásokra, amelyek lehetővé teszik a modell folyamatos fejlesztését és óriási léptékű telepítését. Kell legyen legalább egy MI-alapú terméked, amelyet rengetegen használnak, ideális esetben pedig több is. És hozzá kell férned a felhasználóid minél több egyéb adatához, a személyes információiktól az online tevékenységükön át egészen a számítógépükön lévő fájlokig.
Ezek közül mindegyik elem önmagában is összetett és erős verseny tárgya, nem véletlen, hogy az OpenAI vezérigazgatója, Sam Altman folyamatosan arról beszél, hogy már pusztán a számítási kapacitáshoz is ezermilliárd dollárokra lenne szüksége. Úgy tűnik azonban, hogy a Google az az egyetlen vállalat, amelynél minden darab már a helyén van. Az elmúlt évben, sőt az elmúlt napokban is olyan lépéseket tett, amelyek arra utalnak, hogy készen áll arra, hogy az MI legnagyobb és legnagyobb hatású szereplőjévé váljon.
A szükséges infrastrukturális munka nagy része tavaly zajlott le. Novemberben a Google bemutatta a Gemini 3-at, amelyet széles körben a jelenlegi piac legjobb általános nagy nyelvi modelljének tartanak. A legtöbb benchmarkteszten győz, és a legtöbb szakértő egyetért abban, hogy a feladatok többségében az élmezőnyben van, vagy közvetlenül annak tetején. Természetesen az uralma nem tart örökké, hiszen még mindig abban a szakaszban vagyunk, amikor nagyjából hathetente bukkan fel egy új legjobb modell, de a Google bebizonyította, hogy a legjobb munkája következetesen az iparág legjobbja.
A Gemini 3 egyik fontos tényezője az volt, ahogyan betanították: a Google saját TPU-it használták hozzá, egy rendkívül speciális chipet, amelyet a vállalat évek óta épít kifejezetten erre a célra. A Google természetesen ugyanúgy ki van téve bizonyos gyártási problémáknak és a memóriaárak emelkedésének, mint bárki más, de a versenytársai többségével ellentétben nem függ az Nvidia ellátási láncától. A Google képes az egész rendszerét egyben optimalizálni, hogy jobb, gyorsabb és olcsóbb legyen. Senki más nem rendelkezik ilyen szintű, teljes vertikumot átfogó kontrollal az MI-sorsa felett.
Mit tesz az ember, ha a technológia már készen van? Az emberek elé viszi, és munkába állítja. Január közepén a Google és az Apple bejelentette, hogy a Gemini fogja működtetni az idén érkező, következő generációs Sirít. Ez hatalmas siker az Apple számára, amely a hírek szerint évi 1 milliárd dollárt fizet azért a reményért, hogy a Siri végre valóban hasznos MI-asszisztenssé váljon. A Google számára ez legalább ilyen fontos. Az, hogy az Apple kimondja, ez a jelenleg elérhető legjobb technológia, nyilvánvalóan erős jelzés a piacnak, de ennél is lényegesebb, hogy a Siri azonnal az egyik legnépszerűbb módjává válik annak, ahogyan az emberek kapcsolatba lépnek a Geminivel.
Az Apple egyik vezetője, Craig Federighi 2024-ben azt mondta, hogy a Siri naponta nagyjából 1,5 milliárd kérést dolgoz fel, és bár az új megállapodás pontos részleteit nem ismerjük, feltételezhető, hogy ezek jelentős része hamarosan a Geminin fut majd át. Remélhetőleg az időzítő beállítása - az egyetlen dolog, amit a Siri továbbra is jól csinál - nem kap egy új és bonyolultabb háttérrendszert. Összehasonlításképpen, Altman tavaly azt mondta, hogy a ChatGPT napi 2,5 milliárd promptot kap. A Gemini alkalmazás gyorsan növekszik, de még mindig jócskán le van maradva a ChatGPT mögött, ám a Siri bevonása segíthet a Google-nek gyorsabban felzárkózni.
Egy technológiai megállapodás természetesen nem azonos azzal, hogy a Gemini teljesen kiszorítja a Sirít, és a Google bizonyára azt is szeretné, ha a Siri a kérdéseket a Gemininek passzolná tovább, ahogyan azt jelenleg a ChatGPT-vel teszi. A megállapodás mégis számít, mert minden felhasználó számít. Minél több felhasználói aktivitást és adatot tudnak ezek a cégek összegyűjteni, annál jobbak lesznek a modelljeik és a termékeik. A közelmúltbeli keresési per részben éppen erről az önmagát erősítő mechanizmusról szólt, és ez az MI esetében is ugyanígy igaz.
A Google másik friss bejelentése még nagyobb erődemonstráció. Bemutatott egy választható funkciót Personal Intelligence néven, amely összeköti a Geminit azzal az óriási információtengerrel, amelyet a Google az emberekről tárol, hogy jobb válaszokat adhasson. Mostantól minden egyes kérdésre úgy válaszolhat a Gemini, hogy megnézi az adott illető legutóbbi kereséseit, a YouTube-on nézett videóit, az e-mailjeit, a fotóit, a fájljait és még sok mást. Nehéz túlbecsülni, mekkora jelentőségű ez. A Google-nek többé nem kell kérnie a további kontextus megadását, nem kell reménykednie kell abban, hogy minden alkalommal kiváló és részletes promptokat kap, vagy bonyolult egyedi utasításrendszereket kelljen kiépítenie. A Google már eddig is ijesztően sok mindent tudott az emberekről, és most már a Gemini is.
Jelenleg a Personal Intelligence béta állapotban érhető el az MI-előfizetésért fizető felhasználók egy szűkebb körének. Idővel a Google tervei szerint mindenkihez, mindenhol eljut majd. És el akarja vinni a Google legfontosabb termékébe is, a világ legnépszerűbb weboldalára, a keresőjébe. A keresésben megjelenő MI mód egyelőre csak egy fül az általános találatok mellett, de a Google teljesen egyértelműen a keresés jövőjének tekinti. A Geminit pedig egy olyan kapuvá akarja alakítani, amelyen keresztül elérhető minden adat, amit a Google rólad, az internetről és a világról tud.
2022-ben, amikor a ChatGPT elindult, egyértelmű volt, hogy a Google-t váratlanul érte a fejlemény. De jár neki a dicséret, mert kiérdemelte. Egy olyan vállalat esetében, amely nem éppen arról híres, hogy képes lenne egy koherens termékstratégiára összpontosítani, a Google mégis képes volt jelentős erőforrásait egyetlen irányba terelni. Most pedig, ha a chatbotok valóban a jövőt jelentik, és az MI-ipar nagy része továbbra is erre fogad, akkor jelenleg egyszerűen nincs más vállalat, amely valóban képes lenne versenyezni a Google-lel. A Google-nek megvannak a modelljei. Megvannak az erőforrásai a fejlesztésükhöz. Most már megvan az a terjesztési ereje is, amely szükséges ahhoz, hogy az emberek használják a botjait, valamint az az adatvagyon, amely egyedien személyessé és hasznossá teheti őket. Egyelőre a ChatGPT-nek van meg a márkaereje és a napi aktív felhasználói bázisa. A Google-nek viszont szinte minden más is. Még az iPhone is.
Ha az MI-ben nyerni akarsz, és itt a legnagyobb, legjövedelmezőbb, a világot a saját képedre formáló értelemben vett győzelemről van szó, akkor egyszerre kell sok nehéz dolgot megcsinálnod. Olyan modellel kell rendelkezned, amely vitathatatlanul a piac legjobbjai közé tartozik. Szükséged van azokra a szinte végtelen erőforrásokra, amelyek lehetővé teszik a modell folyamatos fejlesztését és óriási léptékű telepítését. Kell legyen legalább egy MI-alapú terméked, amelyet rengetegen használnak, ideális esetben pedig több is. És hozzá kell férned a felhasználóid minél több egyéb adatához, a személyes információiktól az online tevékenységükön át egészen a számítógépükön lévő fájlokig.
Ezek közül mindegyik elem önmagában is összetett és erős verseny tárgya, nem véletlen, hogy az OpenAI vezérigazgatója, Sam Altman folyamatosan arról beszél, hogy már pusztán a számítási kapacitáshoz is ezermilliárd dollárokra lenne szüksége. Úgy tűnik azonban, hogy a Google az az egyetlen vállalat, amelynél minden darab már a helyén van. Az elmúlt évben, sőt az elmúlt napokban is olyan lépéseket tett, amelyek arra utalnak, hogy készen áll arra, hogy az MI legnagyobb és legnagyobb hatású szereplőjévé váljon.
A szükséges infrastrukturális munka nagy része tavaly zajlott le. Novemberben a Google bemutatta a Gemini 3-at, amelyet széles körben a jelenlegi piac legjobb általános nagy nyelvi modelljének tartanak. A legtöbb benchmarkteszten győz, és a legtöbb szakértő egyetért abban, hogy a feladatok többségében az élmezőnyben van, vagy közvetlenül annak tetején. Természetesen az uralma nem tart örökké, hiszen még mindig abban a szakaszban vagyunk, amikor nagyjából hathetente bukkan fel egy új legjobb modell, de a Google bebizonyította, hogy a legjobb munkája következetesen az iparág legjobbja.
A Gemini 3 egyik fontos tényezője az volt, ahogyan betanították: a Google saját TPU-it használták hozzá, egy rendkívül speciális chipet, amelyet a vállalat évek óta épít kifejezetten erre a célra. A Google természetesen ugyanúgy ki van téve bizonyos gyártási problémáknak és a memóriaárak emelkedésének, mint bárki más, de a versenytársai többségével ellentétben nem függ az Nvidia ellátási láncától. A Google képes az egész rendszerét egyben optimalizálni, hogy jobb, gyorsabb és olcsóbb legyen. Senki más nem rendelkezik ilyen szintű, teljes vertikumot átfogó kontrollal az MI-sorsa felett.
Mit tesz az ember, ha a technológia már készen van? Az emberek elé viszi, és munkába állítja. Január közepén a Google és az Apple bejelentette, hogy a Gemini fogja működtetni az idén érkező, következő generációs Sirít. Ez hatalmas siker az Apple számára, amely a hírek szerint évi 1 milliárd dollárt fizet azért a reményért, hogy a Siri végre valóban hasznos MI-asszisztenssé váljon. A Google számára ez legalább ilyen fontos. Az, hogy az Apple kimondja, ez a jelenleg elérhető legjobb technológia, nyilvánvalóan erős jelzés a piacnak, de ennél is lényegesebb, hogy a Siri azonnal az egyik legnépszerűbb módjává válik annak, ahogyan az emberek kapcsolatba lépnek a Geminivel.
Az Apple egyik vezetője, Craig Federighi 2024-ben azt mondta, hogy a Siri naponta nagyjából 1,5 milliárd kérést dolgoz fel, és bár az új megállapodás pontos részleteit nem ismerjük, feltételezhető, hogy ezek jelentős része hamarosan a Geminin fut majd át. Remélhetőleg az időzítő beállítása - az egyetlen dolog, amit a Siri továbbra is jól csinál - nem kap egy új és bonyolultabb háttérrendszert. Összehasonlításképpen, Altman tavaly azt mondta, hogy a ChatGPT napi 2,5 milliárd promptot kap. A Gemini alkalmazás gyorsan növekszik, de még mindig jócskán le van maradva a ChatGPT mögött, ám a Siri bevonása segíthet a Google-nek gyorsabban felzárkózni.
Egy technológiai megállapodás természetesen nem azonos azzal, hogy a Gemini teljesen kiszorítja a Sirít, és a Google bizonyára azt is szeretné, ha a Siri a kérdéseket a Gemininek passzolná tovább, ahogyan azt jelenleg a ChatGPT-vel teszi. A megállapodás mégis számít, mert minden felhasználó számít. Minél több felhasználói aktivitást és adatot tudnak ezek a cégek összegyűjteni, annál jobbak lesznek a modelljeik és a termékeik. A közelmúltbeli keresési per részben éppen erről az önmagát erősítő mechanizmusról szólt, és ez az MI esetében is ugyanígy igaz.
A Google másik friss bejelentése még nagyobb erődemonstráció. Bemutatott egy választható funkciót Personal Intelligence néven, amely összeköti a Geminit azzal az óriási információtengerrel, amelyet a Google az emberekről tárol, hogy jobb válaszokat adhasson. Mostantól minden egyes kérdésre úgy válaszolhat a Gemini, hogy megnézi az adott illető legutóbbi kereséseit, a YouTube-on nézett videóit, az e-mailjeit, a fotóit, a fájljait és még sok mást. Nehéz túlbecsülni, mekkora jelentőségű ez. A Google-nek többé nem kell kérnie a további kontextus megadását, nem kell reménykednie kell abban, hogy minden alkalommal kiváló és részletes promptokat kap, vagy bonyolult egyedi utasításrendszereket kelljen kiépítenie. A Google már eddig is ijesztően sok mindent tudott az emberekről, és most már a Gemini is.
Jelenleg a Personal Intelligence béta állapotban érhető el az MI-előfizetésért fizető felhasználók egy szűkebb körének. Idővel a Google tervei szerint mindenkihez, mindenhol eljut majd. És el akarja vinni a Google legfontosabb termékébe is, a világ legnépszerűbb weboldalára, a keresőjébe. A keresésben megjelenő MI mód egyelőre csak egy fül az általános találatok mellett, de a Google teljesen egyértelműen a keresés jövőjének tekinti. A Geminit pedig egy olyan kapuvá akarja alakítani, amelyen keresztül elérhető minden adat, amit a Google rólad, az internetről és a világról tud.
2022-ben, amikor a ChatGPT elindult, egyértelmű volt, hogy a Google-t váratlanul érte a fejlemény. De jár neki a dicséret, mert kiérdemelte. Egy olyan vállalat esetében, amely nem éppen arról híres, hogy képes lenne egy koherens termékstratégiára összpontosítani, a Google mégis képes volt jelentős erőforrásait egyetlen irányba terelni. Most pedig, ha a chatbotok valóban a jövőt jelentik, és az MI-ipar nagy része továbbra is erre fogad, akkor jelenleg egyszerűen nincs más vállalat, amely valóban képes lenne versenyezni a Google-lel. A Google-nek megvannak a modelljei. Megvannak az erőforrásai a fejlesztésükhöz. Most már megvan az a terjesztési ereje is, amely szükséges ahhoz, hogy az emberek használják a botjait, valamint az az adatvagyon, amely egyedien személyessé és hasznossá teheti őket. Egyelőre a ChatGPT-nek van meg a márkaereje és a napi aktív felhasználói bázisa. A Google-nek viszont szinte minden más is. Még az iPhone is.