| ISBN/价格: | 978-7-302-68567-8:CNY108.00 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | 强化学习的数学原理/.赵世钰著 |
| 出版发行项: | 北京:,清华大学出版社:,2025 |
| 载体形态项: | xx, 271页:;+图 (部分彩图):;+26cm |
| 相关题名附注: | 英文并列题名取自封面 |
| 提要文摘: | 本书从强化学习最基本的概念开始介绍, 将介绍基础的分析工具, 包括贝尔曼方程和贝尔曼最优方程, 然后推广到基于模型的和无模型的强化学习算法, 最后推广到基于值函数和策略函数的强化学习方法。本书强调从数学的角度引入概念、分析问题、分析算法。本书不要求读者具备任何关于强化学习的知识背景, 仅要求读者具备一定的概率论和线性代数的知识。如果读者已经具备强化学习的学习基础, 本书可以帮助读者更深入地理解一些问题并提供新的视角。 |
| 并列题名: | Mathematical foundations of reinforcement learning eng |
| 题名主题: | 机器学习 |
| 中图分类: | TP181 |
| 个人名称等同: | 赵世钰 著 |
| 记录来源: | CN SXSY 20250414 |