| ISBN/价格: | 978-7-115-63490-0:CNY69.80 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | PySpark大数据分析与应用/.戴刚,张良均主编 |
| 出版发行项: | 北京:,人民邮电出版社:,2024 |
| 载体形态项: | 275页:;+图:;+26cm |
| 一般附注: | 大数据技术精品系列教材 人邮教育 |
| 载体形态附注: | 实际页数为:276 |
| 提要文摘: | 本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1-5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例强化PySpark在大数据分析中的实际应用;第6、7章通过基于PySpark的网络招聘信息的职业类型划分和基于PySpark的信用贷款风险分析两个完整的案例实战,结合前5章的PySpark编程知识,实现完整的大数据分析过程。本书大部分章包含实训和课后习题,读者通过练习和操作实践,能够巩固所学的内容。 |
| 并列题名: | Big data analysis and application with Pyspark eng |
| 题名主题: | 数据处理 教材 |
| 中图分类: | TP274 |
| 个人名称等同: | 戴刚 主编 |
| 个人名称等同: | 张良均 主编 |
| 记录来源: | CN SDL 20251015 |