图书馆

书目详细信息： 异策略安全约束强化学习

ISBN/价格：	978-7-118-13707-1:CNY88.00
作品语种：	chi
出版国别：	CN 110000
题名责任者项：	异策略安全约束强化学习/.杨奇松[等]著
出版发行项：	北京:,国防工业出版社:,2025
载体形态项：	xiii, 117页:;+图:;+24cm
相关题名附注：	英文并列题名取自封面
提要文摘：	本书深入探讨了强化学习在现实世界应用中面临的安全挑战, 特别是在与不可预测环境交互时确保智能体的安全性。书中提出了基于约束的强化学习方法, 区分奖励函数与安全相关的成本函数, 以实现安全与性能的平衡。分别针对安全风险控制和训练安全保证问题, 开发了相应的算法。本书不仅贡献了相关安全强化学习算法理论, 也为实践中强化学习的安全应用提供了全面的算法支持, 同时展望了元学习及无重置学习等技术, 以求安全理论的进一步突破, 为追求更安全、可靠的强化学习应用奠定基础。
并列题名：	Off-policy safety constrained reinforcement learning eng
题名主题：	机器学习
中图分类：	TP181
个人名称等同：	杨奇松著
个人名称等同：	常燕著
个人名称等同：	武健著
记录来源：	CN SDL 20251028

总体评分：（共0人）

我的评分：

收藏加入课程