资源简介

MATLAB强化学习代码包,用于解决多步决策模型(网格迷宫问题)的Q-Learning算法。
编程与算法的详细说明可参看我的专栏:https://blog.csdn.net/weixin_43723517/category_9676083.html
"I thought what I'd do was I'd pretend I was one of those deaf-mutes, or should I?"

资源截图

代码片段和文件信息

function outputxy=movement(numinputxyWindyworld)

wind=[Windyworld.windy(inputxy(1)inputxy(2))Windyworld.windx(inputxy(1)inputxy(2))];  %注意:第一个坐标为y坐标,第二个坐标为x坐标
outputxy=inputxy+wind;

if num==1  %(z=1:+x)(z=2:-x)(z=3:+y)(z=4:-y)
    outputxy=outputxy+[01];  %z=1 右移一格
else if num==2
        outputxy=outputxy+[0-1];
    else if num==3
            outputxy=outputxy+[10];
        else if num==4
                outputxy=outputxy+[-10];
            end
        end
    end
end

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件        535  2019-12-29 20:26  Q_learning\movement.m

     文件        412  2020-01-16 08:15  Q_learning\tcegreedy.m

     文件       2407  2020-01-19 15:44  Q_learning\WGW_Qlearning.m

     目录          0  2020-01-19 15:43  Q_learning

----------- ---------  ---------- -----  ----

                 3354                    4


评论

共有 条评论