SG.hu·

A robotoknál is beválhat a pozitív megerősítés

A robotoknál is beválhat a pozitív megerõsítés
Az elsősorban a kutyáknál alkalmazott módszer hatékony lehet a gépeknél is.

A Johns Hopkins Egyetem kutatói kimutatták, hogy egy kizárólag pozitív megerősítéssel lefolytatott tanítás ugyanolyan jó lehet a robotok esetében is, mint például a kutyáknál. Az elvégzett tesztek ugyanis alátámasztották, hogy a Spot nevű gép a pozitív megerősítés alkalmazása mellett sokkal gyorsabban tudott tanulni. A módszer megfelelő használatára egy algoritmus ügyelt. A kedvező eredmények különösen azért fontosak, mert gyakori, hogy a robotoknak bizonyos esetekben viszonylag gyorsan kell megtanulniuk az összetett feladatokat megoldását.

Andrew Hundt doktorandusz elmondta, hogy a gépek kísérletek és tévedések segítségével tanulnak, de a cél az, hogy ezt lehetőleg minél hatékonyabban tegyék. Az új algoritmus megalkotásakor Hundt a kutyáknál alkalmazott pozitív megerősítéses módszert vette alapul. Az algoritmus számos ponttal jutalmazza a robotot, ha jól old meg a feladatot, de semmit sem ad, ha hibázik. A doktorandusz szerint miután a gép minél több pontot akar szerezni, így gyorsan megtanulja a megfelelő viselkedést. Az eljárást először egy szimulált, majd egy valódi robot bevonásával tesztelték.

Hundt hozzátette, hogy eddig a gépeknél egy hónapig tartott, amíg sikerült egy feladat megoldásánál elérni a 100 százalékos pontosságot. Az új eljárással ezt az időt sikerült 2 napra csökkenteni. Ráadásul Spot más képességeket is gyorsan megtanult, többek között azt, hogy miként játsszon egy szimulált navigációs játékkal.

Kapcsolódó cikkek és linkek

Hozzászólások

Jelentkezz be a hozzászóláshoz.

© kvp2020. 12. 05.. 18:08||#2
Ez egy most mar kozel fel evszazados felismeres... (Temporal Credit Assignment in Reinforcement Learning, Richard S. Sutton, 1984)

https://en.wikipedia.org/wiki/Reinforcement_learning

Itt most az tortent, hogy valaki elolvasta az elso feleves MI tankonyveket es kiprobalta, hogy meg mindig jok-e a bennuk leirt algoritmusok?
© T_I2020. 12. 05.. 11:48||#1
Miért ne válna be bármi, ami az embernél, emberi intelligenciánál beválik? A cél, hogy ne lehessen őket egymástól megkülönböztetni, majd pedig, hogy a mesterséges legyen szinte MINDENBEN jobb, mint az ember. Akkor majd kontrollált működés mellett nekünk hasznos feladatokat kell adni neki, amit 7/24-ben megold