• 大小: 982B
    文件类型: .m
    金币: 1
    下载: 0 次
    发布日期: 2021-06-09
  • 语言: Matlab
  • 标签: Q-learning  M  

资源简介

一个简单的Q-Learning算法的综合示例,可以在Matlab仿真平台上实现。

资源截图

代码片段和文件信息

state_num=6;
episode_num=300;

%初始化
gammer=0.8;  %给定折扣因子
reward_R=[
    -1-1-1-10-1;   %设置奖励矩阵R
    -1-1-10-1100;
    -1-1-10-1-1;
    -100-10-1;
    0-1-10-1100;
    -10-1-10100;
    ]
Q_table=zeros(size(reward_R));  %设置初始化矩阵Q
final_state=6;
%For each episode
for i=1:episode_num
    current_state=randperm(state_num1);   %随机选择一个状态
    while current_state~=final_state
    action_option=find(reward_R(

评论

共有 条评论