| ISBN/价格: | 978-7-115-63154-1:CNY79.80 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | JOY RL强化学习实践教程/.江季,王琦,杨毅远著 |
| 出版发行项: | 北京:,人民邮电出版社:,2025 |
| 载体形态项: | 160页:;+图:;+23cm |
| 提要文摘: | 本书是继《Easy RL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学 理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。 |
| 题名主题: | 机器学习 教材 |
| 中图分类: | TP181 |
| 个人名称等同: | 江季 著 |
| 个人名称等同: | 王琦 著 |
| 个人名称等同: | 杨毅远 著 |
| 记录来源: | CN XHWX 20250709 |