MARC状态:审校 文献类型:中文图书 浏览次数:6
- 题名/责任者:
- Apache Spark大数据分析:基于Azure Databricks云平台/(瑞典)罗伯特·伊特杰森(Robert Ilijason)著 袁国忠译
- 出版发行项:
- 北京:人民邮电出版社,2023
- ISBN及定价:
- 978-7-115-61456-8/CNY79.80
- 载体形态项:
- 236页;23cm
- 并列正题名:
- Beginning Apache Spark using Azure Databricks:unleashing large cluster analytics in the cloud
- 个人责任者:
- (瑞典) 伊特杰森 (Ilijason, Robert) 著
- 个人次要责任者:
- 袁国忠 (计算机) 译
- 学科主题:
- 数据处理软件-机器学习
- 非控制主题词:
- Spark
- 中图法分类号:
- TP274
- 版本附注:
- 由Apress Media, LLC授权出版
- 提要文摘附注:
- 本书总计11章,首先介绍大规模数据分析相关的概念;然后介绍受管的Spark及其与Databricks的关系,以及Databricks的版本差异和使用方法;接着介绍使用SQL和Python分别实现数据分析的过程,数据提取、变换、加载、存储、优化技巧等高阶数据处理方法以及外部连接工具、生产环境集成等内容;最后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 校区—馆藏地 | 书刊状态 | 还书位置 |
TP274/122 | 5200263339 | 总馆—新馆综合阅览区(三楼) | 可借 | 新馆综合阅览区(三楼) | |
TP274/122 | 5200263340 | 总馆—新馆综合阅览区(三楼) | 可借 | 新馆综合阅览区(三楼) |
显示全部馆藏信息