| ISBN/价格: | 978-7-302-68591-3:CNY99.00 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | 强化学习基础、原理与应用/.张百珂编著 |
| 出版发行项: | 北京:,清华大学出版社:,2025 |
| 载体形态项: | 394页:;+图:;+26cm |
| 提要文摘: | 本书共分为17章, 主要内容包括强化学习基础、马尔可夫决策过程、蒙特卡洛方法、Q-learning与贝尔曼方程、时序差分学习和SARSA算法、DQN算法、DDQN算法、竞争DQN算法、REINFORCE算法、Actor-Critic算法、PPO算法、TRPO算法、连续动作空间的强化学习、值分布式算法、基于模型的强化学习、多智能体强化学习实战: Predator-Prey游戏及自动驾驶系统。 |
| 题名主题: | 面向对象语言 程序设计 |
| 中图分类: | TP312.8PY |
| 个人名称等同: | 张百珂 编著 |
| 记录来源: | CN SDL 20260128 |