| ISBN/价格: | 978-7-118-13707-1:CNY88.00 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | 异策略安全约束强化学习/.杨奇松[等]著 |
| 出版发行项: | 北京:,国防工业出版社:,2025 |
| 载体形态项: | xiii, 117页:;+图:;+24cm |
| 相关题名附注: | 英文并列题名取自封面 |
| 提要文摘: | 本书深入探讨了强化学习在现实世界应用中面临的安全挑战, 特别是在与不可预测环境交互时确保智能体的安全性。书中提出了基于约束的强化学习方法, 区分奖励函数与安全相关的成本函数, 以实现安全与性能的平衡。分别针对安全风险控制和训练安全保证问题, 开发了相应的算法。本书不仅贡献了相关安全强化学习算法理论, 也为实践中强化学习的安全应用提供了全面的算法支持, 同时展望了元学习及无重置学习等技术, 以求安全理论的进一步突破, 为追求更安全、可靠的强化学习应用奠定基础。 |
| 并列题名: | Off-policy safety constrained reinforcement learning eng |
| 题名主题: | 机器学习 |
| 中图分类: | TP181 |
| 个人名称等同: | 杨奇松 著 |
| 个人名称等同: | 常燕 著 |
| 个人名称等同: | 武健 著 |
| 记录来源: | CN SDL 20251028 |