本书的目的就是为了消除这种高门槛,并通过使用初级数学中的“平均值”等概念,对强化学习中的“价值”“探索”和“马尔可夫性”等基本概念进行浅显易懂的解释。 对于每个算法,本书将使用“多臂老虎机问题”或“网格世界问题”中的一个,以易于比较的状态进行解释,这样,可以让读者更直观地理解各算法的特点和差异。此外,对于核心算法,本书提供了使用Python和MATLAB编写的两种类型的代码,通过运行这些代码,可以让读者直观地理解“原理→公式→程序”的一系列流程。
馆藏号 | 馆藏地名称 | 索书号 | 文献状态 | 操作 |
---|---|---|---|---|
250405047 | 新书二库(二楼201) (图书馆二楼201) | TP181 304 | 在馆 | 转借 |
250405048 | 新书二库(二楼201) (图书馆二楼201) | TP181 304 | 在馆 | 转借 |
预约情况:当前已有0人预约,还可 1人预约
预约
作者:高军;杜敏
出版:广东科技出版社,2025
作者:邓峰
出版:化学工业出版社,2025
作者:雷波
出版:化学工业出版社,2025
作者:胡仁宗;刘辉;孟凡博
出版:化学工业出版社,2025
作者:王香善;李广超
出版:化学工业出版社,2025
剪映短视频剪辑从入门到精通:宣传短片+电商视频+产品广告+活动庆典
作者:龙飞;王静
出版:化学工业出版社,2025