叶梓老师 《强化学习》第一期
第一课 强化学习综述
第二课 马尔科夫决策过程
第三课 基于模型的动态规划方法
第四课 蒙特卡罗方法
第五课 时序差分方法
第六课 基于值函数逼近方法
第七课 策略梯度方法
第八课 AC方法
第九课 信赖域系方法
第十课 多Agent强化学习
江苏省网友说:帮顶,等大佬们分享!
黑龙江省网友说:或者类似内容的课程。
黑龙江省网友说:教程不少,看不懂,等大佬来
吉林省网友说:好高深的样子,楼下大佬来
叶梓老师 《强化学习》第一期
第一课 强化学习综述
第二课 马尔科夫决策过程
第三课 基于模型的动态规划方法
第四课 蒙特卡罗方法
第五课 时序差分方法
第六课 基于值函数逼近方法
第七课 策略梯度方法
第八课 AC方法
第九课 信赖域系方法
第十课 多Agent强化学习
江苏省网友说:帮顶,等大佬们分享!
黑龙江省网友说:或者类似内容的课程。
黑龙江省网友说:教程不少,看不懂,等大佬来
吉林省网友说:好高深的样子,楼下大佬来