• kvp
    #2
    Ez egy most mar kozel fel evszazados felismeres... (Temporal Credit Assignment in Reinforcement Learning, Richard S. Sutton, 1984)

    https://en.wikipedia.org/wiki/Reinforcement_learning

    Itt most az tortent, hogy valaki elolvasta az elso feleves MI tankonyveket es kiprobalta, hogy meg mindig jok-e a bennuk leirt algoritmusok?