SG.hu
A megerősített tanulás két úttörője nyerte el idén a Turing-díjat

A megerősített tanulás két úttörője nyerte el az Association for Computing Machinery 1 millió dolláros díját. A díjazottak a mesterséges intelligenciamodellek nem biztonságos alkalmazására figyelmeztetnek.
A mesterséges intelligencia fellendülésében alapvető szerepet játszó megerősített tanulás tudományos technikájának két úttörője az idei Turing-díj elnyerése után figyelmeztetett a mesterséges intelligencia modellek nem biztonságos alkalmazására. Andrew Barto, a Massachusettsi Egyetem emeritus professzora és Richard Sutton, az Albertai Egyetem professzora és a DeepMind egykori kutatója az úttörő módszer kifejlesztéséért kapta az Association for Computing Machinery 1 millió dolláros díját. Barto és Sutton az 1980-as években fejlesztette ki a megerősítéses tanulást, miután a pszichológia és az emberek tanulási szokásai inspirálták őket. A gépi tanulási technika, amely a kívánt viselkedésért jutalmazza a mesterséges intelligencia rendszereket, hozzájárult a világ néhány vezető mesterséges intelligencia csoportjának, például az OpenAI-nak és a Google-nek a sikeréhez.
A gyakran a számítástechnika Nobel-díjának nevezett díj nyertesei elmondták, hogy aggódnak amiatt, hogy az MI-vállalatok elsietik a termékek piacra dobását, mielőtt alaposan tesztelnék azokat. "Egy szoftvert emberek millióinak biztosítékok nélkül kiadni nem jó mérnöki gyakorlat” - mondta Barto, és ezt ahhoz hasonlította, mintha egy hidat építenénk, majd úgy tesztelnénk, hogy az emberek használják. "A mérnöki gyakorlat úgy alakult ki, hogy megpróbálja enyhíteni a technológia negatív következményeit, és nem látom, hogy a fejlesztő cégek ezt gyakorolnák” - tette hozzá.
Az Alan Turing brit matematikusról elnevezett díjat azután ítélték oda, hogy októberben a kémiai és a fizikai Nobel-díjjal is elismerték a mesterséges intelligencia áttörését. Ez rávilágított a számítástechnikai eszközök és az adattudomány fontosságára az összetett tudományos problémák sokkal rövidebb idő alatt történő megoldása terén. "A Barto és Sutton által kifejlesztett eszközök a mesterséges intelligencia boomjának központi pillérei, amelyek jelentős előrelépéseket tettek lehetővé, fiatal kutatók légióit vonzották, és dollármilliárdos befektetésekhez vezettek. A megerősített tanulás hatása a jövőben is folytatódni fog” - mondta Jeff Dean, a díjat szponzoráló Google alelnöke. A Google DeepMind ezt a technikát használta az AlphaGo nevű mesterséges intelligencia rendszer kifejlesztéséhez, amely legyőzte az emberi játékosokat a Go játékban, ami jelentős mérföldkő volt a mesterséges intelligencia kutatásában. Az OpenAI a ChatGPT kimenetének irányításához szintén a megerősített tanulás egy olyan típusát használta, amely emberi visszajelzésekre támaszkodik.
Barto és Sutton azonban egyaránt figyelmeztetett a mesterséges intelligencia fejlesztésének jelenlegi ütemére, amikor a cégek versenyt futnak a nagy teljesítményű, de hibázásra hajlamos modellek piacra dobásával, soha nem látott mennyiségű finanszírozást gyűjtve és milliárdokat fektetve az olyan infrastruktúrákba, mint például az adatközpontok, a mesterséges intelligencia képzésére és működtetésére. A nagy technológiai csoportok szerint a mesterséges intelligenciára fordított kiadások idén meghaladhatják a 320 milliárd dollárt, míg a 2022-ben a ChatGPT-t elindító OpenAI jelenleg 40 milliárd dollárnyi új finanszírozást gyűjt 260 milliárd dolláros értékelés mellett.
Barto bírálta az MI-ágazatot, hogy az MI-kutatás előmozdítása helyett üzleti ösztönzők motiválják. "Az az elképzelés, hogy hatalmas adatközpontokkal rendelkezünk, majd a szoftver használatáért egy bizonyos összeget felszámítunk, motiválja a dolgokat, de én ezt az indítékot nem támogatnám” - tette hozzá. Az OpenAI azzal érvelt, hogy további befektetéseket kell felszabadítania egy hagyományosabb vállalati struktúrán keresztül, hogy elérje a vállalat alapító „küldetését”, vagyis azt, hogy a mesterséges általános intelligencia (AGI) - egy olyan forgatókönyv, amelyben a számítógépes rendszerek az emberhez hasonló vagy annál magasabb szintű intelligenciát érnek el - az emberiség javát szolgálja. Sutton azonban „hype”-ként utasította el a technológiai vállalatok AGI-vel kapcsolatos narratíváját. "Az AGI egy furcsa kifejezés, mert mindig is létezett mesterséges intelligencia, és az emberek mindig is próbálták megérteni az intelligenciát”. Hozzátette, hogy „az embernél intelligensebb rendszerek” előbb-utóbb létre fognak jönni az emberi elme jobb megértése révén.
Barto és Sutton bírálta Donald Trump amerikai elnök azon kísérletét is, hogy csökkentse a tudományos kutatásra fordított szövetségi kiadásokat és elbocsátásokat eszközöljön az amerikai tudományos ügynökségeknél. Ennek pusztító következményei lehetnek az USA tudományos dominanciájára nézve - mondta Barto, aki ezt „helytelennek és tragikusnak nevezte nemcsak az ország, hanem a világ számára is”. Hozzátette, hogy a megerősítő tanulással kapcsolatos munkájukhoz hasonló kutatások lehetőségei „eltűnnének”, ha nem lenne szabadságuk absztrakt, nem bizonyított koncepciókat vizsgálni. Aggodalmaik ellenére mindkét tudós optimista a megerősítő tanulás és a mesterséges intelligencia által kínált lehetőségeket illetően, amelyek pozitív eredményeket hozhatnak a világ számára.
A mesterséges intelligencia fellendülésében alapvető szerepet játszó megerősített tanulás tudományos technikájának két úttörője az idei Turing-díj elnyerése után figyelmeztetett a mesterséges intelligencia modellek nem biztonságos alkalmazására. Andrew Barto, a Massachusettsi Egyetem emeritus professzora és Richard Sutton, az Albertai Egyetem professzora és a DeepMind egykori kutatója az úttörő módszer kifejlesztéséért kapta az Association for Computing Machinery 1 millió dolláros díját. Barto és Sutton az 1980-as években fejlesztette ki a megerősítéses tanulást, miután a pszichológia és az emberek tanulási szokásai inspirálták őket. A gépi tanulási technika, amely a kívánt viselkedésért jutalmazza a mesterséges intelligencia rendszereket, hozzájárult a világ néhány vezető mesterséges intelligencia csoportjának, például az OpenAI-nak és a Google-nek a sikeréhez.
A gyakran a számítástechnika Nobel-díjának nevezett díj nyertesei elmondták, hogy aggódnak amiatt, hogy az MI-vállalatok elsietik a termékek piacra dobását, mielőtt alaposan tesztelnék azokat. "Egy szoftvert emberek millióinak biztosítékok nélkül kiadni nem jó mérnöki gyakorlat” - mondta Barto, és ezt ahhoz hasonlította, mintha egy hidat építenénk, majd úgy tesztelnénk, hogy az emberek használják. "A mérnöki gyakorlat úgy alakult ki, hogy megpróbálja enyhíteni a technológia negatív következményeit, és nem látom, hogy a fejlesztő cégek ezt gyakorolnák” - tette hozzá.
Az Alan Turing brit matematikusról elnevezett díjat azután ítélték oda, hogy októberben a kémiai és a fizikai Nobel-díjjal is elismerték a mesterséges intelligencia áttörését. Ez rávilágított a számítástechnikai eszközök és az adattudomány fontosságára az összetett tudományos problémák sokkal rövidebb idő alatt történő megoldása terén. "A Barto és Sutton által kifejlesztett eszközök a mesterséges intelligencia boomjának központi pillérei, amelyek jelentős előrelépéseket tettek lehetővé, fiatal kutatók légióit vonzották, és dollármilliárdos befektetésekhez vezettek. A megerősített tanulás hatása a jövőben is folytatódni fog” - mondta Jeff Dean, a díjat szponzoráló Google alelnöke. A Google DeepMind ezt a technikát használta az AlphaGo nevű mesterséges intelligencia rendszer kifejlesztéséhez, amely legyőzte az emberi játékosokat a Go játékban, ami jelentős mérföldkő volt a mesterséges intelligencia kutatásában. Az OpenAI a ChatGPT kimenetének irányításához szintén a megerősített tanulás egy olyan típusát használta, amely emberi visszajelzésekre támaszkodik.
Barto és Sutton azonban egyaránt figyelmeztetett a mesterséges intelligencia fejlesztésének jelenlegi ütemére, amikor a cégek versenyt futnak a nagy teljesítményű, de hibázásra hajlamos modellek piacra dobásával, soha nem látott mennyiségű finanszírozást gyűjtve és milliárdokat fektetve az olyan infrastruktúrákba, mint például az adatközpontok, a mesterséges intelligencia képzésére és működtetésére. A nagy technológiai csoportok szerint a mesterséges intelligenciára fordított kiadások idén meghaladhatják a 320 milliárd dollárt, míg a 2022-ben a ChatGPT-t elindító OpenAI jelenleg 40 milliárd dollárnyi új finanszírozást gyűjt 260 milliárd dolláros értékelés mellett.
Barto bírálta az MI-ágazatot, hogy az MI-kutatás előmozdítása helyett üzleti ösztönzők motiválják. "Az az elképzelés, hogy hatalmas adatközpontokkal rendelkezünk, majd a szoftver használatáért egy bizonyos összeget felszámítunk, motiválja a dolgokat, de én ezt az indítékot nem támogatnám” - tette hozzá. Az OpenAI azzal érvelt, hogy további befektetéseket kell felszabadítania egy hagyományosabb vállalati struktúrán keresztül, hogy elérje a vállalat alapító „küldetését”, vagyis azt, hogy a mesterséges általános intelligencia (AGI) - egy olyan forgatókönyv, amelyben a számítógépes rendszerek az emberhez hasonló vagy annál magasabb szintű intelligenciát érnek el - az emberiség javát szolgálja. Sutton azonban „hype”-ként utasította el a technológiai vállalatok AGI-vel kapcsolatos narratíváját. "Az AGI egy furcsa kifejezés, mert mindig is létezett mesterséges intelligencia, és az emberek mindig is próbálták megérteni az intelligenciát”. Hozzátette, hogy „az embernél intelligensebb rendszerek” előbb-utóbb létre fognak jönni az emberi elme jobb megértése révén.
Barto és Sutton bírálta Donald Trump amerikai elnök azon kísérletét is, hogy csökkentse a tudományos kutatásra fordított szövetségi kiadásokat és elbocsátásokat eszközöljön az amerikai tudományos ügynökségeknél. Ennek pusztító következményei lehetnek az USA tudományos dominanciájára nézve - mondta Barto, aki ezt „helytelennek és tragikusnak nevezte nemcsak az ország, hanem a világ számára is”. Hozzátette, hogy a megerősítő tanulással kapcsolatos munkájukhoz hasonló kutatások lehetőségei „eltűnnének”, ha nem lenne szabadságuk absztrakt, nem bizonyított koncepciókat vizsgálni. Aggodalmaik ellenére mindkét tudós optimista a megerősítő tanulás és a mesterséges intelligencia által kínált lehetőségeket illetően, amelyek pozitív eredményeket hozhatnak a világ számára.