SG.hu - Fórum - A robotoknál is beválhat a pozitív megerősítés

Cikk olvasása: A robotoknál is beválhat a pozitív megerősítés

Ugrás a topicra

kvp

#2 2020.12.05. 18:08

Ez egy most mar kozel fel evszazados felismeres... (Temporal Credit Assignment in Reinforcement Learning, Richard S. Sutton, 1984)

https://en.wikipedia.org/wiki/Reinforcement_learning

Itt most az tortent, hogy valaki elolvasta az elso feleves MI tankonyveket es kiprobalta, hogy meg mindig jok-e a bennuk leirt algoritmusok?