资源简介

强化学习中的一个重要里程碑就是Q学习算法,使用matlab 进行单步Q学习无障碍路径规划仿真,设学习次数为200.

资源截图

代码片段和文件信息

function rv=drnd(xp)
% discrete random variable 离散随机变量
% Input:
%      [xp]: distribution分布、分配
% Output:
%      rv: 
%---------------------------------
% Principle: P(xi=x(i))=P(r:[Fi-1Fi))(F0=0)
%                      =Pi;
% Attention: sum(p)=1
%---------------------------------
% Date: 15-Nov-2010
% Designer: William Song

l=size(x2);%size(X1)返回矩阵X的行数;size(X2)返回矩阵X的列数;
   
if p==0
    p=ones(1l)/l;    % uniform distribution 均匀分布
elseif sum(p)~=1
    p=p/sum(p);
end

F=cumsum(p);F0=[0F(1:end-1)];
r=rand(1);
rv=x(:(F0<=r)&(r

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件        594  2015-11-18 13:58  matlab Q学习仿真\drnd.asv

     文件        603  2015-11-18 14:00  matlab Q学习仿真\drnd.m

     文件        573  2015-11-18 16:08  matlab Q学习仿真\QDemo.asv

     文件        590  2015-11-18 16:09  matlab Q学习仿真\QDemo.m

     文件       1959  2015-11-20 15:16  matlab Q学习仿真\Qlearning.asv

     文件       2039  2015-11-20 15:41  matlab Q学习仿真\Qlearning.m

     文件        325  2010-11-16 16:52  matlab Q学习仿真\ReadMe.txt

     目录          0  2015-11-18 13:53  matlab Q学习仿真

----------- ---------  ---------- -----  ----

                 6683                    8


评论

共有 条评论