SG.hu
Az MI-vezérelt böngészők új korszakot nyitnak a webhasználatban
Az OpenAI, a Google és az új kihívók harcolnak azért, hogy kié legyen a jövő legfontosabb szövegmezője.
Az OpenAI eredetileg nem tervezett böngészőt készíteni - legalábbis nem rögtön -, a ChatGPT megjelenése után viszont a fejlesztők azt vették észre, hogy sok felhasználó párhuzamosan dolgozik a böngészőjében és a ChatGPT-ben: megnyitnak egy tabot, kimásolják, bemásolják a másikba a szöveget, segítséget kérnek, majd visszamásolják a javaslatot. A böngésző az a felület, ahol a felhasználók vannak, és ha tényleg egy általános célú mesterséges intelligencia asszisztens fog dolgozni helyettünk, akkor a cégnek szüksége van egy ilyen szoftverre. Ennek eredményeképp született meg a ChatGPT Atlas, egy egyszerű, minden új tabon ChatGPT-szövegmezőt kínáló böngésző, amely képes információt adni az éppen nyitott lap tartalmáról, űrlapokat kitölteni a weben, sőt kérésre megpróbálhat vásárolni, lekérdezheti a teljes böngészési előzményünket vagy felhasználhatja a korábbi munkákból, beszélgetésekből megismert kontextust.
Hasonló ötletek gyorsan megjelentek másoknál is, ezért született meg a Perplexity Cometje, a The Browser Company Dia böngészője, a Microsoft Edge MI-funkciói, sőt a Chrome is kapott egy nagy Gemini-beültetést. Mind ugyanazt a célt követik: a böngészőt átformálni úgy, hogy az MI-asszisztenseknek mindenhez hozzáférést és kontextust adjon, és így a felhasználók könnyebben rájuk bízhassák a feladatokat.
A böngésző látszólag unalmas, megoldott problémának tűnt az elmúlt évtizedben: az eszközödön lévő szoftverrel letöltöd a Chrome-ot és elégedetten használod. Pedig a böngésző az a hely, amely hozzáfér a leveleinkhez, bankszámláinkhoz, munkafájlokhoz, a közösségi felületekhez, tehát óriási mennyiségű információt tartalmaz rólunk és tevékenységünkről. Éppen ezért sok cég az elmúlt évek „nagy platform-vadászatában” arra jutott, hogy a böngésző lehet az új csatatér. A mobil kétplatform-duopólium után itt van egy régi, de jövedelmező alapalkalmazás, amelyre új funkciókat lehet építeni, és amely révén kevesebb függés lehet az alkalmazásboltoktól.
A verseny három nagy korszakra osztható: az első böngészőháború idején (Mosaic -> Netscape -> Microsoft Internet Explorer) arról szólt, hogy az emberek egyáltalán hozzáférjenek az oldalakhoz; a másodikban (Firefox és Google Chrome felemelkedése) arról, hogy a web alkalmazássá váljon; a mostani, harmadik hullám pedig arról szólhat, hogy a böngésző a web-ügynökök platformjává váljon.
Három fő okból akarnak a cégek böngészőt fejleszteni. Az első a személyes adatok begyűjtése; a böngésző ismeri az ember által meglátogatott összes weblapot és tevékenységet. Ennél részletesebb profilokat nehéz gyűjteni máshol, és ebben rengeteg pénz van. A Perplexity vezére, Aravind Srinivas például nyíltan beszélt arról, hogy a böngészőn kívüli adatokat is gyűjtenék, hogy jobb felhasználói profilokat építsenek és hirdetéseket jelenítsenek meg a Discover-feedben.
A második az, hogy a böngésző maga egy hatékony alkalmazásplatform. Ezzel jelentkezünk be mindenhova, a banktól kezdve az emailen át az Instagramig, és a böngésző sütik révén közel korlátlan hozzáférést kap azokhoz az alkalmazásokhoz. És egy olyan ügynöknek, amely jegyet foglal vagy vásárol, ilyen hozzáférésre van szüksége. A harmadik pedig talán a legfontosabb: a böngésző birtokolja a számítógép legfontosabb bemeneti felületét, a címsort, ami az a szövegmező, ahol kifejezzük a szándékainkat. The Browser Company CTO-ja, Hursh Agrawal szerint ez a legértékesebb pont egy MI-központú jövőben. Ha az MI-interakciók átveszik a keresések szerepét, ennek a mezőnek olyan magától értetődőnek kell lennie, mint a Google keresősávjának.
Mindez jó elmélet, de számos kétség él a megvalósíthatósággal kapcsolatban. Az úgynevezett ügynöki mesterséges intelligencia ma messze nem működik megbízhatóan, és nem biztos, hogy a viselkedési vagy technológiai változások, amelyekre a versenyzők számítanak, valóban bekövetkeznek. Biztonsági és adatvédelmi aggályok is vannak: ha az asszisztens ajánl egy cipőt, honnan tudható, hogy az valóban a legjobb ajánlat az embernek, és nem egy fizetett megállapodás eredménye? A prompt-injection rémére is sokan figyelmeztetnek: rosszindulatú szereplők manipulálhatják a modellt, hogy saját érdekeiket szolgálja. A Mozilla a választás és a kontroll fontosságát hangsúlyozza: kié lesz a modell, hogyan gyűjtik a felhasználói adatokat, hogyan választhatunk modellek között? Ezekre a kérdésekre a válaszok kevésbé technikaiak, inkább bizalmi természetűek.
A piaci realitás nem a feltörekvők mellett van. A Chrome piaci részesedése ijesztő, hozzávetőlegesen 4 milliárd felhasználóval és a böngészőpiac kétharmadától háromnegyedéig terjedő dominanciával. De a szabályozói környezet változik, és itt leginkább a böngészőválasztó képernyőt kell hangsúlyozni, mely lehetőséget ad az alternatív böngészőknek. A Google-t antitröszt perek sorozata támadja, ami lassíthatja a reakcióit, ez pedig ablakot nyit a versenytársaknak. Emellett az is tény, hogy ma elég könnyű böngészőt építeni a Chromium-alapok miatt, ami ugyancsak serkenti a belépést.
Katasztrofális lehet Google számára a startupok álmának valósággá válása, azaz ha a felhasználók újraértékelik böngészőválasztásukat és egy MI-modellt helyeznek a keresősáv helyére Megrendülne a kereső-böngésző kombináció alappillére, és látványos változások indulnának el. MI-funkciókkal lehetne rendezni a laphalmazokat, kérdezni lehetne a böngészési előzményekről, de maga a böngészőablak alapformája is átalakulhat. A verseny megmutathatja a böngészőablakok és a felső szövegmező jelentőségét, de egyúttal átalakíthatja a viszonyunkat a webhez. Kevesebb URL-típus, több beszélgetés a botokkal, több automatizáció.
Ugyanakkor az is elképzelhető, hogy a felhasználók nem adják át életük adatait tömegesen egyetlen vállalatnak vagy modellnek. Az MI-asszisztensek átláthatatlanná és automatizálttá tehetik a webet, ami új problémákat szülhet. Ismeretlen elfogultságok, üzleti megállapodások által fűtött ajánlások és sebezhetőségek várnak majd ránk. Parisa Tabriz, a Chrome-csapat vezetője úgy fogalmaz, hogy a Google „tudatosan és körültekintőeen” halad, mert az MI rengeteg lehetőséget nyit, de nagy kockázatokat is rejt, különösen az ügynöki böngészők prompt-sebezhetőségei miatt. Ugyanakkor a Chrome-ba integrált Gemini-t is támogatja, mert a web és a böngészés szerinte továbbra is fantasztikus, és az MI-val karöltve új képességeket hozhat be a mindennapi munkába.
A harc csak most kezdődik. A böngészőháborúk visszatértek, immár a böngészők lelkéért folynak. Több szereplő van jelen, eltérő elképzelésekkel arról, hogy mit jelentsen a böngészés jövője. A győztesé lesz a számítógép legfontosabb szövegmezője, és az, hogy hogyan definiáljuk a webhez való viszonyunkat a következő évtizedben. Ám ennél is fontosabb, hogy a végső kérdés nem technikai, hanem etikai és politikai. Kinek a kezében legyen a személyes kontextus, ki döntsön arról, hogy egy asszisztens milyen forrásokat emel ki, és hogyan tartható meg a web nyitottsága, miközben a cégek az MI-ból szeretnének versenyelőnyt kovácsolni? A böngészők újra fontosak lettek, de immár nem csupán oldalak megjelenítésére szolgálnak, hanem a tét ennél jóval nagyobb.
Az OpenAI eredetileg nem tervezett böngészőt készíteni - legalábbis nem rögtön -, a ChatGPT megjelenése után viszont a fejlesztők azt vették észre, hogy sok felhasználó párhuzamosan dolgozik a böngészőjében és a ChatGPT-ben: megnyitnak egy tabot, kimásolják, bemásolják a másikba a szöveget, segítséget kérnek, majd visszamásolják a javaslatot. A böngésző az a felület, ahol a felhasználók vannak, és ha tényleg egy általános célú mesterséges intelligencia asszisztens fog dolgozni helyettünk, akkor a cégnek szüksége van egy ilyen szoftverre. Ennek eredményeképp született meg a ChatGPT Atlas, egy egyszerű, minden új tabon ChatGPT-szövegmezőt kínáló böngésző, amely képes információt adni az éppen nyitott lap tartalmáról, űrlapokat kitölteni a weben, sőt kérésre megpróbálhat vásárolni, lekérdezheti a teljes böngészési előzményünket vagy felhasználhatja a korábbi munkákból, beszélgetésekből megismert kontextust.
Hasonló ötletek gyorsan megjelentek másoknál is, ezért született meg a Perplexity Cometje, a The Browser Company Dia böngészője, a Microsoft Edge MI-funkciói, sőt a Chrome is kapott egy nagy Gemini-beültetést. Mind ugyanazt a célt követik: a böngészőt átformálni úgy, hogy az MI-asszisztenseknek mindenhez hozzáférést és kontextust adjon, és így a felhasználók könnyebben rájuk bízhassák a feladatokat.
A böngésző látszólag unalmas, megoldott problémának tűnt az elmúlt évtizedben: az eszközödön lévő szoftverrel letöltöd a Chrome-ot és elégedetten használod. Pedig a böngésző az a hely, amely hozzáfér a leveleinkhez, bankszámláinkhoz, munkafájlokhoz, a közösségi felületekhez, tehát óriási mennyiségű információt tartalmaz rólunk és tevékenységünkről. Éppen ezért sok cég az elmúlt évek „nagy platform-vadászatában” arra jutott, hogy a böngésző lehet az új csatatér. A mobil kétplatform-duopólium után itt van egy régi, de jövedelmező alapalkalmazás, amelyre új funkciókat lehet építeni, és amely révén kevesebb függés lehet az alkalmazásboltoktól.
A verseny három nagy korszakra osztható: az első böngészőháború idején (Mosaic -> Netscape -> Microsoft Internet Explorer) arról szólt, hogy az emberek egyáltalán hozzáférjenek az oldalakhoz; a másodikban (Firefox és Google Chrome felemelkedése) arról, hogy a web alkalmazássá váljon; a mostani, harmadik hullám pedig arról szólhat, hogy a böngésző a web-ügynökök platformjává váljon.
Három fő okból akarnak a cégek böngészőt fejleszteni. Az első a személyes adatok begyűjtése; a böngésző ismeri az ember által meglátogatott összes weblapot és tevékenységet. Ennél részletesebb profilokat nehéz gyűjteni máshol, és ebben rengeteg pénz van. A Perplexity vezére, Aravind Srinivas például nyíltan beszélt arról, hogy a böngészőn kívüli adatokat is gyűjtenék, hogy jobb felhasználói profilokat építsenek és hirdetéseket jelenítsenek meg a Discover-feedben.
A második az, hogy a böngésző maga egy hatékony alkalmazásplatform. Ezzel jelentkezünk be mindenhova, a banktól kezdve az emailen át az Instagramig, és a böngésző sütik révén közel korlátlan hozzáférést kap azokhoz az alkalmazásokhoz. És egy olyan ügynöknek, amely jegyet foglal vagy vásárol, ilyen hozzáférésre van szüksége. A harmadik pedig talán a legfontosabb: a böngésző birtokolja a számítógép legfontosabb bemeneti felületét, a címsort, ami az a szövegmező, ahol kifejezzük a szándékainkat. The Browser Company CTO-ja, Hursh Agrawal szerint ez a legértékesebb pont egy MI-központú jövőben. Ha az MI-interakciók átveszik a keresések szerepét, ennek a mezőnek olyan magától értetődőnek kell lennie, mint a Google keresősávjának.
Mindez jó elmélet, de számos kétség él a megvalósíthatósággal kapcsolatban. Az úgynevezett ügynöki mesterséges intelligencia ma messze nem működik megbízhatóan, és nem biztos, hogy a viselkedési vagy technológiai változások, amelyekre a versenyzők számítanak, valóban bekövetkeznek. Biztonsági és adatvédelmi aggályok is vannak: ha az asszisztens ajánl egy cipőt, honnan tudható, hogy az valóban a legjobb ajánlat az embernek, és nem egy fizetett megállapodás eredménye? A prompt-injection rémére is sokan figyelmeztetnek: rosszindulatú szereplők manipulálhatják a modellt, hogy saját érdekeiket szolgálja. A Mozilla a választás és a kontroll fontosságát hangsúlyozza: kié lesz a modell, hogyan gyűjtik a felhasználói adatokat, hogyan választhatunk modellek között? Ezekre a kérdésekre a válaszok kevésbé technikaiak, inkább bizalmi természetűek.
A piaci realitás nem a feltörekvők mellett van. A Chrome piaci részesedése ijesztő, hozzávetőlegesen 4 milliárd felhasználóval és a böngészőpiac kétharmadától háromnegyedéig terjedő dominanciával. De a szabályozói környezet változik, és itt leginkább a böngészőválasztó képernyőt kell hangsúlyozni, mely lehetőséget ad az alternatív böngészőknek. A Google-t antitröszt perek sorozata támadja, ami lassíthatja a reakcióit, ez pedig ablakot nyit a versenytársaknak. Emellett az is tény, hogy ma elég könnyű böngészőt építeni a Chromium-alapok miatt, ami ugyancsak serkenti a belépést.
Katasztrofális lehet Google számára a startupok álmának valósággá válása, azaz ha a felhasználók újraértékelik böngészőválasztásukat és egy MI-modellt helyeznek a keresősáv helyére Megrendülne a kereső-böngésző kombináció alappillére, és látványos változások indulnának el. MI-funkciókkal lehetne rendezni a laphalmazokat, kérdezni lehetne a böngészési előzményekről, de maga a böngészőablak alapformája is átalakulhat. A verseny megmutathatja a böngészőablakok és a felső szövegmező jelentőségét, de egyúttal átalakíthatja a viszonyunkat a webhez. Kevesebb URL-típus, több beszélgetés a botokkal, több automatizáció.
Ugyanakkor az is elképzelhető, hogy a felhasználók nem adják át életük adatait tömegesen egyetlen vállalatnak vagy modellnek. Az MI-asszisztensek átláthatatlanná és automatizálttá tehetik a webet, ami új problémákat szülhet. Ismeretlen elfogultságok, üzleti megállapodások által fűtött ajánlások és sebezhetőségek várnak majd ránk. Parisa Tabriz, a Chrome-csapat vezetője úgy fogalmaz, hogy a Google „tudatosan és körültekintőeen” halad, mert az MI rengeteg lehetőséget nyit, de nagy kockázatokat is rejt, különösen az ügynöki böngészők prompt-sebezhetőségei miatt. Ugyanakkor a Chrome-ba integrált Gemini-t is támogatja, mert a web és a böngészés szerinte továbbra is fantasztikus, és az MI-val karöltve új képességeket hozhat be a mindennapi munkába.
A harc csak most kezdődik. A böngészőháborúk visszatértek, immár a böngészők lelkéért folynak. Több szereplő van jelen, eltérő elképzelésekkel arról, hogy mit jelentsen a böngészés jövője. A győztesé lesz a számítógép legfontosabb szövegmezője, és az, hogy hogyan definiáljuk a webhez való viszonyunkat a következő évtizedben. Ám ennél is fontosabb, hogy a végső kérdés nem technikai, hanem etikai és politikai. Kinek a kezében legyen a személyes kontextus, ki döntsön arról, hogy egy asszisztens milyen forrásokat emel ki, és hogyan tartható meg a web nyitottsága, miközben a cégek az MI-ból szeretnének versenyelőnyt kovácsolni? A böngészők újra fontosak lettek, de immár nem csupán oldalak megjelenítésére szolgálnak, hanem a tét ennél jóval nagyobb.