| ISBN/价格: | 978-7-302-68692-7:CNY99.00 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | 多模态大模型/.韩晓晨著 |
| 出版发行项: | 北京:,清华大学出版社:,2025 |
| 载体形态项: | 324页:;+图:;+24cm |
| 相关题名附注: | 英文并列题名取自封面 |
| 提要文摘: | 本书系统地介绍多模态大模型的理论基础、关键技术与实际应用。全书分为两部分12章, 第1部分 (第1-5章) 围绕基础理论与技术解析展开论述, 包括基本概念、Transformer架构、跨模态对齐、模态融合, 以及多模态大模型的预训练方法、模型微调与优化等, 为理解多模态大模型的构建逻辑奠定基础。第2部分 (第6-12章) 聚集于多模态大模型的高级应用与场景实现, 包括主流视觉语言模型 (如CLIP、BLIP-2等) 的实现、跨模态推理与生成的技术应用、多模态大模型的推理与优化方法、模型的安全与可信性问题, 并通过多模态检索与推荐系统、多模态语义理解系统和多模态问答系统的端到端开发实践, 展示了多模态大模型的实际落地路径。 |
| 并列题名: | Multimodal large models eng |
| 题名主题: | 人工智能 |
| 中图分类: | TP18 |
| 个人名称等同: | 韩晓晨 著 |
| 记录来源: | CN SXSY 20250409 |