图书介绍
Spark快速数据处理2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- (美)凯洛著 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111463115
- 出版时间:2014
- 标注页数:116页
- 文件大小:12MB
- 文件页数:134页
- 主题词:数据处理软件-程序设计
PDF下载
下载说明
Spark快速数据处理PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 安装Spark以及构建Spark集群1
1.1单机运行Spark4
1.2在EC2上运行Spark5
1.3在ElasticMapReduce上部署Spark11
1.4用Chef(opscode)部署Spark12
1.5在Mesos上部署Spark14
1.6在Yam上部署Spark15
1.7通过SSH部署集群16
1.8链接和参考21
1.9小结21
第2章Spark shell的使用23
2.1加载一个简单的text文件24
2.2用Spark shell运行逻辑回归26
2.3交互式地从S3加载数据28
2.4小结30
第3章 构建并运行Spark应用31
3.1用sbt构建Spark作业32
3.2用Maven构建Spark作业36
3.3用其他工具构建Spark作业39
3.4小结39
第4章 创建SparkContext41
4.1 Scala43
4.2 Java43
4.3 Java和Scala共享的API44
4.4 Python45
4.5链接和参考45
4.6小结46
第5章 加载与保存数据47
5.1 RDD48
5.2加载数据到RDD中49
5.3保存数据54
5.4连接和参考55
5.5小结55
第6章 操作RDD 57
6.1用Scala和Java操作RDD58
6.2用Python操作RDD79
6.3链接和参考83
6.4小结84
第7章Shark-Hive和Spark的综合运用85
7.1为什么用Hive/Shark86
7.2安装Shark86
7.3运行Shark88
7.4加载数据88
7.5在Spark程序中运行HiveQL查询89
7.6链接和参考92
7.7小结93
第8章 测试95
8.1用Java和Scala测试96
8.2用Python测试103
8.3链接和参考104
8.4小结105
第9章 技巧和窍门107
9.1日志位置108
9.2并发限制108
9.3内存使用与垃圾回收109
9.4序列化110
9.5 IDE集成环境111
9.6 Spark与其他语言112
9.7安全提示113
9.8邮件列表113
9.9链接和参考113
9.10小结114
热门推荐
- 2288581.html
- 2937091.html
- 1298968.html
- 2812515.html
- 382039.html
- 2061472.html
- 2470934.html
- 3439937.html
- 2283027.html
- 1523273.html
- http://www.ickdjs.cc/book_1186359.html
- http://www.ickdjs.cc/book_3690355.html
- http://www.ickdjs.cc/book_1441972.html
- http://www.ickdjs.cc/book_3646977.html
- http://www.ickdjs.cc/book_2395160.html
- http://www.ickdjs.cc/book_1416775.html
- http://www.ickdjs.cc/book_1008524.html
- http://www.ickdjs.cc/book_1496259.html
- http://www.ickdjs.cc/book_279166.html
- http://www.ickdjs.cc/book_2395590.html