SG.hu
Elképesztően ambiciózus asszisztens a Rabbit R1
A mesterséges intelligenciával működő kütyü helyettünk használja az alkalmazásokat. Nem csak egy chatbot, hanem egy olyan eszköz, amellyel potenciálisan szinte bármi megtehető.
Jesse Lyu, a Rabbit nevű MI startup vezérigazgatója és alapítója azt mondja, nem akarja helyettesíteni az okostelefont. Legalábbis nem azonnal. Cége terméke, az R1 nevű, 199 dolláros önálló MI-eszköz kicsit úgy néz ki, mint egy kvarcjáték, vagy talán egy '90-es évekbeli japán kézitévé modernizált változata. Ez egy önálló, körülbelül fele akkora masina, mint egy telefon, 2,88 collos érintőképernyővel, egy forgó kamerával a fényképek és videók készítéséhez, valamint egy görgetőkerékkel / gombbal, amelyet megnyomva navigálhatunk vagy beszélhetünk a készülék beépített asszisztensével. 2,3 GHz-es MediaTek processzorral, 4 GB memóriával és 128 GB tárhellyel rendelkezik egy ujjlenyomat mágnes lekerekített testben, amelyet a Teenage Engineering tervezőcéggel együttműködve hoztak létre. Az internethez WiFi-n keresztül csatlakozik, az akkumulátorról a Rabbit csak annyit mond, hogy "egész nap" bírja.
De a csoda a benne lévő szoftver, a Rabbit operációs rendszere (az úgynevezett Rabbit OS) és az alatta lévő MI-technológia. A ChatGPT-szerű nagy nyelvi modell helyett a Rabbit OS egy „nagy akciómodellre” (Large Action Model, LAM) épül, az alkalmazások univerzális vezérlőjeként. "Hogyan találhatunk univerzális megoldást szolgáltatásaink tényleges elindítására, függetlenül attól, hogy webhelyről vagy alkalmazásról vagy bármilyen platformról vagy asztali számítógépről van szó?” - tette fel a kérdést Lyu. Lényege az Alexához vagy a Google Asszisztenshez hasonlít: a Rabbit OS képes zenét berakni, jegyet rendelni, élelmiszert vásárolni, üzeneteket küldeni és még sok minden mást egyetlen felületen keresztül. Nincsenek benne alkalmazások és bejelentkezések - az alapötlet szerint csak végrehajtja amit szeretnénk.
Az R1 képernyőjén egy sor kategória-alapú kártya jelenik meg, van zenéhez, közlekedéshez vagy videocsevegéshez, és Lyu szerint a képernyő célja csak a modell kimenetének ellenőrzése. A cég ahelyett, hogy egy saját API-t, fejlesztői felületet hozott volna létre, és várta volna, hogy a többi szolgáltatás csatlakozzon hozzá, inkább arra tréningezte modelljét hogyan használhatja a meglévő alkalmazásokat saját maga. A nagy akciómodellt, vagyis a LAM-ot úgy képezték ki, hogy emberek interakcióba léptek olyan alkalmazásokkal, mint a Spotify és az Uber, lényegében megmutatva a modellnek, hogyan működnek. A LAM megtanulta, hogyan néz ki egy Beállítások ikon, honnan lehet tudni, hogy egy rendelés megerősítésre került, és hol vannak a keresőablakok. Mindez Lyu szerint bárhol, bármilyen alkalmazásnál alkalmazható.
Az R1-nek van egy külön képzési módja is, amellyel megtaníthatjuk a készüléket arra, hogyan kell valamit csinálni, és a jövőben állítólag képes lesz magától megismételni a műveletet. "Például: 'Hé, először is, menj egy Photoshop nevű szoftverhez. Nyisd meg. Fogd meg a fotóidat itt. Csinálj egy lasszót a vízjelen, és kattints katt, katt, katt, katt, katt. Így távolítsd el a vízjelet"." Lyu szerint a Rabbit OS-nek 30 másodpercig tart a feldolgozás, majd a továbbiakban automatikusan eltávolítja az összes vízjelet.
Az igazi kérdés persze az, hogy hogy mindez hogyan működik majd a gyakorlatban. Néhány dolgot magán az eszközön is megtehető, de van egy Rabbit Hole nevű webes portál is, amelyen keresztül bejelentkezhetünk a különböző szolgáltatásokba. Ha például meg akarod tanítani az eszközt a Photoshop használatára, akkor a saját eszközöd és szoftvered használata helyett a Rabbit egyik virtuális gépét indíthatod el, és ott taníthatod meg. De hogy ez hogyan fog működni sok felhasználó, sok eszköz és platform esetén, azt nehéz lesz jól megoldani.
A Rabbit megközelítése elég okos. Egy új operációs rendszer támogatására nehéz rávenni bárkit is, még akkor is, ha egy technológiai óriásról van szó. A LAM módszer ezt azzal kerüli meg, hogy egyszerűen megtanítja a modellt az alkalmazások használatára. Tágabb értelemben véve, egyre több új, mesterséges intelligenciával működő hardver kerül a piacra, de általában ezek a kütyük csak egy chatbothoz csatlakoznak. A Rabbit ezzel szemben inkább egy szuperalkalmazáshoz hasonlít - egyetlen felület, amelyen keresztül szinte bármi megtehető. Ami a ChatGPT a webes keresésnek, az a Rabbit OS az alkalmazásboltnak. Ennek az álomnak persze ezernyi bonyodalma és nehézsége van, de érdekes álom.
A Rabbit OS és az R1-ről közel sem elég erős ahhoz, hogy helyettesítsen egy okostelefont. Bár képes videohívásokat indítani és van SIM-kártya foglalata, elsősorban hangalapú asszisztens, de a készülék rendelkezik képernyővel és kamerával is. A Rabbit azt mondja, hogy a Rabbit OS-t a biztonság és az adatvédelem szem előtt tartásával tervezte, de a felületén keresztül elvárja, hogy jelentkezzünk be a leggyakrabban használt szolgáltatásainkba. Az R1 Lyu szerint egyszerre egy ügyes kiegészítő és egy nagyjából mindenre kiterjedő mindenes. Az R1 már előrendelhető, Lyu szerint az eszköz szállítása márciusban kezdődik.
Jesse Lyu, a Rabbit nevű MI startup vezérigazgatója és alapítója azt mondja, nem akarja helyettesíteni az okostelefont. Legalábbis nem azonnal. Cége terméke, az R1 nevű, 199 dolláros önálló MI-eszköz kicsit úgy néz ki, mint egy kvarcjáték, vagy talán egy '90-es évekbeli japán kézitévé modernizált változata. Ez egy önálló, körülbelül fele akkora masina, mint egy telefon, 2,88 collos érintőképernyővel, egy forgó kamerával a fényképek és videók készítéséhez, valamint egy görgetőkerékkel / gombbal, amelyet megnyomva navigálhatunk vagy beszélhetünk a készülék beépített asszisztensével. 2,3 GHz-es MediaTek processzorral, 4 GB memóriával és 128 GB tárhellyel rendelkezik egy ujjlenyomat mágnes lekerekített testben, amelyet a Teenage Engineering tervezőcéggel együttműködve hoztak létre. Az internethez WiFi-n keresztül csatlakozik, az akkumulátorról a Rabbit csak annyit mond, hogy "egész nap" bírja.
De a csoda a benne lévő szoftver, a Rabbit operációs rendszere (az úgynevezett Rabbit OS) és az alatta lévő MI-technológia. A ChatGPT-szerű nagy nyelvi modell helyett a Rabbit OS egy „nagy akciómodellre” (Large Action Model, LAM) épül, az alkalmazások univerzális vezérlőjeként. "Hogyan találhatunk univerzális megoldást szolgáltatásaink tényleges elindítására, függetlenül attól, hogy webhelyről vagy alkalmazásról vagy bármilyen platformról vagy asztali számítógépről van szó?” - tette fel a kérdést Lyu. Lényege az Alexához vagy a Google Asszisztenshez hasonlít: a Rabbit OS képes zenét berakni, jegyet rendelni, élelmiszert vásárolni, üzeneteket küldeni és még sok minden mást egyetlen felületen keresztül. Nincsenek benne alkalmazások és bejelentkezések - az alapötlet szerint csak végrehajtja amit szeretnénk.
Az R1 képernyőjén egy sor kategória-alapú kártya jelenik meg, van zenéhez, közlekedéshez vagy videocsevegéshez, és Lyu szerint a képernyő célja csak a modell kimenetének ellenőrzése. A cég ahelyett, hogy egy saját API-t, fejlesztői felületet hozott volna létre, és várta volna, hogy a többi szolgáltatás csatlakozzon hozzá, inkább arra tréningezte modelljét hogyan használhatja a meglévő alkalmazásokat saját maga. A nagy akciómodellt, vagyis a LAM-ot úgy képezték ki, hogy emberek interakcióba léptek olyan alkalmazásokkal, mint a Spotify és az Uber, lényegében megmutatva a modellnek, hogyan működnek. A LAM megtanulta, hogyan néz ki egy Beállítások ikon, honnan lehet tudni, hogy egy rendelés megerősítésre került, és hol vannak a keresőablakok. Mindez Lyu szerint bárhol, bármilyen alkalmazásnál alkalmazható.
Az R1-nek van egy külön képzési módja is, amellyel megtaníthatjuk a készüléket arra, hogyan kell valamit csinálni, és a jövőben állítólag képes lesz magától megismételni a műveletet. "Például: 'Hé, először is, menj egy Photoshop nevű szoftverhez. Nyisd meg. Fogd meg a fotóidat itt. Csinálj egy lasszót a vízjelen, és kattints katt, katt, katt, katt, katt. Így távolítsd el a vízjelet"." Lyu szerint a Rabbit OS-nek 30 másodpercig tart a feldolgozás, majd a továbbiakban automatikusan eltávolítja az összes vízjelet.
Az igazi kérdés persze az, hogy hogy mindez hogyan működik majd a gyakorlatban. Néhány dolgot magán az eszközön is megtehető, de van egy Rabbit Hole nevű webes portál is, amelyen keresztül bejelentkezhetünk a különböző szolgáltatásokba. Ha például meg akarod tanítani az eszközt a Photoshop használatára, akkor a saját eszközöd és szoftvered használata helyett a Rabbit egyik virtuális gépét indíthatod el, és ott taníthatod meg. De hogy ez hogyan fog működni sok felhasználó, sok eszköz és platform esetén, azt nehéz lesz jól megoldani.
A Rabbit megközelítése elég okos. Egy új operációs rendszer támogatására nehéz rávenni bárkit is, még akkor is, ha egy technológiai óriásról van szó. A LAM módszer ezt azzal kerüli meg, hogy egyszerűen megtanítja a modellt az alkalmazások használatára. Tágabb értelemben véve, egyre több új, mesterséges intelligenciával működő hardver kerül a piacra, de általában ezek a kütyük csak egy chatbothoz csatlakoznak. A Rabbit ezzel szemben inkább egy szuperalkalmazáshoz hasonlít - egyetlen felület, amelyen keresztül szinte bármi megtehető. Ami a ChatGPT a webes keresésnek, az a Rabbit OS az alkalmazásboltnak. Ennek az álomnak persze ezernyi bonyodalma és nehézsége van, de érdekes álom.
A Rabbit OS és az R1-ről közel sem elég erős ahhoz, hogy helyettesítsen egy okostelefont. Bár képes videohívásokat indítani és van SIM-kártya foglalata, elsősorban hangalapú asszisztens, de a készülék rendelkezik képernyővel és kamerával is. A Rabbit azt mondja, hogy a Rabbit OS-t a biztonság és az adatvédelem szem előtt tartásával tervezte, de a felületén keresztül elvárja, hogy jelentkezzünk be a leggyakrabban használt szolgáltatásainkba. Az R1 Lyu szerint egyszerre egy ügyes kiegészítő és egy nagyjából mindenre kiterjedő mindenes. Az R1 már előrendelhető, Lyu szerint az eszköz szállítása márciusban kezdődik.