SG.hu
Az emberek túlbecsülik a generatív mesterséges intelligenciát
Az MIT robotikai professzora, Rodney Brooks szerint az emberek túlbecsülik a generatív mesterséges intelligenciát.
Ha Rodney Brooks a robotikáról vagy a mesterséges intelligenciáról beszél, érdemes odafigyelni. A Stanford Egyetemen doktorált, a Massachusetts Institute of Technology robotikai professzora, emellett három kulcsfontosságú vállalat társalapítója, köztük a Rethink Robotics, az iRobot, mostani vállalkozása pedig a Robust.ai. Brooks 1997-től kezdve egy évtizeden át vezette az MIT Számítástudományi és Mesterséges Intelligencia Laboratóriumát (CSAIL) is. Szeret jóslatokat tenni a mesterséges intelligencia jövőjével kapcsolatban, és blogján listát vezet arról, hogy mennyire jönnek azok be. Szerinte itt az ideje, hogy fékezzük a generatív mesterséges intelligenciával kapcsolatos hype-ot. "Nem azt mondom, hogy az LLM-ek nem fontosak, de óvatosnak kell lennünk azzal, hogy hogyan értékeljük őket" - mondta.
Szerinte az MI-vel az a baj, hogy bár tökéletesen alkalmas bizonyos feladatok elvégzésére, de az állítások ellenére nem képes mindenre, amire egy ember, és az emberek hajlamosak túlbecsülni a képességeit. "Amikor egy ember azt látja, hogy egy mesterséges intelligencia rendszer végrehajt egy feladatot, azonnal általánosítja azt hasonló dolgokra, és becslést készít az MI rendszer kompetenciájáról; nem csak a teljesítményéről, hanem az azt körülvevő képességekről is" - mondta Brooks. "És általában mindenki túl optimista. Ez azért van, mert egy olyan feltételezést használnak, amely az emberek által nyújtott teljesítményről szól." Leszögezi, hogy a generatív mesterséges intelligencia nem emberi vagy akár emberhez hasonló, és hibás megpróbálni emberi képességeket rendelni hozzá. Szerinte az emberek olyannyira kompetensnek látják, hogy még olyan alkalmazásokra is használni akarják, amelyekre semmi értelme.
Brooks erre példaként hozza fel legújabb cégét, a Robust.ai-t, mely egy raktárrobotikai rendszert fejleszt. Valaki nemrég azt javasolta neki, hogy egy LLM közbeiktatásával kellene utasítani a raktárrobotjait, hogy merre menjenek. Szerinte azonban ez nem ésszerű felhasználási eset a generatív mesterséges intelligencia számára, és valójában lelassítaná a dolgokat. Ehelyett sokkal egyszerűbb a robotokat a raktárkezelő szoftverből érkező adatfolyamhoz csatlakoztatni. "Amikor 10 000 rendelés érkezik be, amelyet két órán belül ki kell szállítani, akkor egy beszélt nyelv nem fog segíteni, csak lelassítja a dolgokat" - mondta. "Nagyon erős adatfeldolgozási és masszív optimalizálási technikákkal rendelkezünk. Így tudjuk gyorsan teljesíteni a megrendeléseket".
Egy másik lecke, amit Brooks megtanult a robotokkal és az MI-val kapcsolatban, hogy felesleges túl sokat kísérletezni. Olyan megoldható dolgokkal kell foglalkozni, amelyekbe a robotok könnyen integrálhatók. "Olyan helyeken kell automatizálnunk, ahol a dolgok már egyértelműek. A cégem a raktárakban jól teljesít, de azok a területek valójában eléggé korlátozottak. A világítás nem változik ezekben a nagy csarnokokban. A padlón nem hevernek dolgok, mert a kocsikat tologató emberek beleszaladnának. Nincsenek lebegő műanyag zacskók, amikbe beleütközhetnének. És az ott dolgozó embereknek sem áll érdekében, hogy rosszindulatúak legyenek a robottal szemben" - mondta.
Brooks kifejtette, hogy a robotok és az emberek együttműködését is figyelembe kell venni, hiszen a cége ezeket a robotokat a raktári műveletekhez kapcsolódó gyakorlati célokra tervezte, nem pedig embernek látszó humanoid robotokat készítettek. "Az általunk használt formafaktor nem humanoid, hanem úgy néznek ki, mint a bevásárlókocsik" - mondta. "Van rajta egy kormány, így ha valami probléma van a robottal, egy ember megragadhatja azt és azt csinál vele, amit akar" - mondta. Ennyi év után Brooks megtanulta, hogy a technológia hozzáférhetővé és célzottan használhatóvá tételéről van szó. "Mindig arra törekszem, hogy a technológiát az emberek számára könnyen érthetővé tegyem, és így nagy léptékben is be tudjuk vetni. Mindig nézzük az üzleti szempontokat, a befektetés megtérülése is nagyon fontos." Brooks szerint még ezzel együtt is el kell fogadnunk, hogy az MI esetében mindig lesznek nehezen megoldható esetek, amelyek megoldása akár évtizedekig is eltarthat. "Az MI-rendszerek bevezetésénél mindig lesz egy sor különleges kivétel, amelyek felfedezése és megoldása évtizedekig tart."
Brooks hozzáteszi, hogy van ez a tévhit, főként Moore törvényének köszönhetően, hogy a technológia tekintetében mindenhol exponenciális növekedés van. Azt mondják az emberek, hogy ha a ChatGPT 4 ilyen jó, képzeljük el, milyen lesz a ChatGPT 5, 6 vagy 7. De ezt a logikát alapvetően hibásnak tartja, a technológia nem mindig skálázódik exponenciálisan. Az iPodot hozza fel példának: az első néhány verzióban valóban megduplázódott a tároló mérete, 10 GB-ról egészen 160 GB-ig. De ha ez a pálya folytatódott volna, akkor 2017-ben már 160 TB-os tárolókapacitású iPod lett volna a zsebünkben, de természetesen nem így történt. A 2017-ben eladott modellek valójában 256 GB-os vagy 160 GB-os tárhellyel érkeztek, mert - mint rámutatott - ennél többre valójában senkinek sem volt szüksége.
Brooks elismeri, hogy az LLM-ek segíthetnének a háztartási robotoknál, ahol speciális feladatokat tudnának ellátni, különösen az öregedő népességet figyelembe véve és azt, hogy nincs elég ember, aki gondoskodjon róluk. De szerinte még ez is sajátos kihívásokkal járna. "Az emberek azt mondják: 'Ó, a nagy nyelvi modelleknek köszönhetően a robotok képesek lesznek olyan dolgokra, amikre eddig nem voltak képesek'. Nem ez a probléma: hogy képesek legyenek dolgokat csinálni az irányításelméletről és mindenféle más hardcore matematikai optimalizálásról szól" - mondta. Brooks kifejtette, hogy ez végül olyan robotokhoz vezethet, amelyek nyelvi interfésszel rendelkeznek az emberek gondozására. "Egy raktárban nem életszerű, hogy egy robotnak azt mondjuk, hogy menjen és hozzon el valamit egy rendeléshez, de az idősek otthoni ápolásában hasznos lehet, ha az emberek képesek lesznek utasításokat adni a robotoknak" - mondta.
Ha Rodney Brooks a robotikáról vagy a mesterséges intelligenciáról beszél, érdemes odafigyelni. A Stanford Egyetemen doktorált, a Massachusetts Institute of Technology robotikai professzora, emellett három kulcsfontosságú vállalat társalapítója, köztük a Rethink Robotics, az iRobot, mostani vállalkozása pedig a Robust.ai. Brooks 1997-től kezdve egy évtizeden át vezette az MIT Számítástudományi és Mesterséges Intelligencia Laboratóriumát (CSAIL) is. Szeret jóslatokat tenni a mesterséges intelligencia jövőjével kapcsolatban, és blogján listát vezet arról, hogy mennyire jönnek azok be. Szerinte itt az ideje, hogy fékezzük a generatív mesterséges intelligenciával kapcsolatos hype-ot. "Nem azt mondom, hogy az LLM-ek nem fontosak, de óvatosnak kell lennünk azzal, hogy hogyan értékeljük őket" - mondta.
Szerinte az MI-vel az a baj, hogy bár tökéletesen alkalmas bizonyos feladatok elvégzésére, de az állítások ellenére nem képes mindenre, amire egy ember, és az emberek hajlamosak túlbecsülni a képességeit. "Amikor egy ember azt látja, hogy egy mesterséges intelligencia rendszer végrehajt egy feladatot, azonnal általánosítja azt hasonló dolgokra, és becslést készít az MI rendszer kompetenciájáról; nem csak a teljesítményéről, hanem az azt körülvevő képességekről is" - mondta Brooks. "És általában mindenki túl optimista. Ez azért van, mert egy olyan feltételezést használnak, amely az emberek által nyújtott teljesítményről szól." Leszögezi, hogy a generatív mesterséges intelligencia nem emberi vagy akár emberhez hasonló, és hibás megpróbálni emberi képességeket rendelni hozzá. Szerinte az emberek olyannyira kompetensnek látják, hogy még olyan alkalmazásokra is használni akarják, amelyekre semmi értelme.
Brooks erre példaként hozza fel legújabb cégét, a Robust.ai-t, mely egy raktárrobotikai rendszert fejleszt. Valaki nemrég azt javasolta neki, hogy egy LLM közbeiktatásával kellene utasítani a raktárrobotjait, hogy merre menjenek. Szerinte azonban ez nem ésszerű felhasználási eset a generatív mesterséges intelligencia számára, és valójában lelassítaná a dolgokat. Ehelyett sokkal egyszerűbb a robotokat a raktárkezelő szoftverből érkező adatfolyamhoz csatlakoztatni. "Amikor 10 000 rendelés érkezik be, amelyet két órán belül ki kell szállítani, akkor egy beszélt nyelv nem fog segíteni, csak lelassítja a dolgokat" - mondta. "Nagyon erős adatfeldolgozási és masszív optimalizálási technikákkal rendelkezünk. Így tudjuk gyorsan teljesíteni a megrendeléseket".
Egy másik lecke, amit Brooks megtanult a robotokkal és az MI-val kapcsolatban, hogy felesleges túl sokat kísérletezni. Olyan megoldható dolgokkal kell foglalkozni, amelyekbe a robotok könnyen integrálhatók. "Olyan helyeken kell automatizálnunk, ahol a dolgok már egyértelműek. A cégem a raktárakban jól teljesít, de azok a területek valójában eléggé korlátozottak. A világítás nem változik ezekben a nagy csarnokokban. A padlón nem hevernek dolgok, mert a kocsikat tologató emberek beleszaladnának. Nincsenek lebegő műanyag zacskók, amikbe beleütközhetnének. És az ott dolgozó embereknek sem áll érdekében, hogy rosszindulatúak legyenek a robottal szemben" - mondta.
Brooks kifejtette, hogy a robotok és az emberek együttműködését is figyelembe kell venni, hiszen a cége ezeket a robotokat a raktári műveletekhez kapcsolódó gyakorlati célokra tervezte, nem pedig embernek látszó humanoid robotokat készítettek. "Az általunk használt formafaktor nem humanoid, hanem úgy néznek ki, mint a bevásárlókocsik" - mondta. "Van rajta egy kormány, így ha valami probléma van a robottal, egy ember megragadhatja azt és azt csinál vele, amit akar" - mondta. Ennyi év után Brooks megtanulta, hogy a technológia hozzáférhetővé és célzottan használhatóvá tételéről van szó. "Mindig arra törekszem, hogy a technológiát az emberek számára könnyen érthetővé tegyem, és így nagy léptékben is be tudjuk vetni. Mindig nézzük az üzleti szempontokat, a befektetés megtérülése is nagyon fontos." Brooks szerint még ezzel együtt is el kell fogadnunk, hogy az MI esetében mindig lesznek nehezen megoldható esetek, amelyek megoldása akár évtizedekig is eltarthat. "Az MI-rendszerek bevezetésénél mindig lesz egy sor különleges kivétel, amelyek felfedezése és megoldása évtizedekig tart."
Brooks hozzáteszi, hogy van ez a tévhit, főként Moore törvényének köszönhetően, hogy a technológia tekintetében mindenhol exponenciális növekedés van. Azt mondják az emberek, hogy ha a ChatGPT 4 ilyen jó, képzeljük el, milyen lesz a ChatGPT 5, 6 vagy 7. De ezt a logikát alapvetően hibásnak tartja, a technológia nem mindig skálázódik exponenciálisan. Az iPodot hozza fel példának: az első néhány verzióban valóban megduplázódott a tároló mérete, 10 GB-ról egészen 160 GB-ig. De ha ez a pálya folytatódott volna, akkor 2017-ben már 160 TB-os tárolókapacitású iPod lett volna a zsebünkben, de természetesen nem így történt. A 2017-ben eladott modellek valójában 256 GB-os vagy 160 GB-os tárhellyel érkeztek, mert - mint rámutatott - ennél többre valójában senkinek sem volt szüksége.
Brooks elismeri, hogy az LLM-ek segíthetnének a háztartási robotoknál, ahol speciális feladatokat tudnának ellátni, különösen az öregedő népességet figyelembe véve és azt, hogy nincs elég ember, aki gondoskodjon róluk. De szerinte még ez is sajátos kihívásokkal járna. "Az emberek azt mondják: 'Ó, a nagy nyelvi modelleknek köszönhetően a robotok képesek lesznek olyan dolgokra, amikre eddig nem voltak képesek'. Nem ez a probléma: hogy képesek legyenek dolgokat csinálni az irányításelméletről és mindenféle más hardcore matematikai optimalizálásról szól" - mondta. Brooks kifejtette, hogy ez végül olyan robotokhoz vezethet, amelyek nyelvi interfésszel rendelkeznek az emberek gondozására. "Egy raktárban nem életszerű, hogy egy robotnak azt mondjuk, hogy menjen és hozzon el valamit egy rendeléshez, de az idősek otthoni ápolásában hasznos lehet, ha az emberek képesek lesznek utasításokat adni a robotoknak" - mondta.