
本书从强化学习最基本的概念开始介绍,将介绍基础的分析工具,包括贝尔曼方程和贝尔曼最优方程,然后推广到基于模型的和无模型的强化学习算法,最后推广到基于值函数和策略函数的强化学习方法。本书强调从数学的角度引入概念、分析问题、分析算法。本书不要求读者具备任何关于强化学习的知识背景,仅要求读者具备一定的概率论和线性代数的知识。如果读者已经具备强化学习的学习基础,本书可以帮助读者更深入地理解一些问题并提供新的视角。
| 馆藏号 | 馆藏地名称 | 索书号 | 文献状态 | 操作 | 
|---|---|---|---|---|
| 250905611 | 新书二库(二楼201) (图书馆二楼201) | TP181 258 | 在馆 | 转借 | 
| 250905612 | 新书二库(二楼201) (图书馆二楼201) | TP181 258 | 在馆 | 转借 | 
预约情况:当前已有0人预约,还可 1人预约
预约
作者:赵世钰
出版:清华大学出版社,2024
作者:文亮; 江维
出版:人民邮电出版社,2025
作者:李明熙
出版:中国戏剧出版社,2025
作者:陈思和; 郜元宝; 张新颖
出版:四川人民出版社,2025
作者:主编王冬梅; 齐誉
出版:华中科技大学出版社,2025
作者:中共中央党史和文献研究院
出版:中央文献出版社,2025