• 大小: 7.37MB
    文件类型: .pdf
    金币: 1
    下载: 0 次
    发布日期: 2021-04-10
  • 语言: 其他
  • 标签: Bandit算法  

资源简介

介绍关于explore和exploit之间平衡的问题,即EE问题,又叫多臂赌博机问题,使用的算法为Bandit算法,例如,UCB、汤普森采样算法等。

资源截图

代码片段和文件信息

评论

共有 条评论

相关资源