资源简介

对于动态系统的控制、决策、稳定性分析是控制学科长期以来的研究热点,基于Bellman提出的动态规划方法,为解决当状态空间和动作空间维数增加带来的维数灾问题,发展产生了自适应动态规划(Adaptive dynamic programming, ADP),这种方法也被称为自适应评价设计、启发式动态规划、 神经元动态规划和增强学习(张化光,张欣,罗艳红,等. 自适应动态规划综述[J]. 自动化学报, 2013, 39(4): 303-311.)。 控制学科对强化学习的研究角度和计算机学科略有不同,这本书作者结合自己多年的研究教学经验,为两个学科的学者提供了更加系统的思路。感兴趣的朋友可以下载看看,仅作交流分享,请勿用于其他用途。 这是一本书的草稿,计划在2019年内定稿,由雅典娜科学公司出版。它表示“正在进行的工作”。它很可能包含错误(希望不是严重的错误)。此外,它对文献的引用是不完整的。欢迎您 向作者提出意见和建议(dimitrib@mit.edu)。

资源截图

代码片段和文件信息

评论

共有 条评论