图书介绍

敏捷数据科学 用Hadoop创建数据分析应用2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

敏捷数据科学 用Hadoop创建数据分析应用
  • (美)朱尔尼著 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121236198
  • 出版时间:2014
  • 标注页数:165页
  • 文件大小:24MB
  • 文件页数:181页
  • 主题词:数据采集

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

敏捷数据科学 用Hadoop创建数据分析应用PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1部分 起步1

第1章 理论3

敏捷大数据3

Big Words定义4

敏捷大数据团队5

认识机遇和问题6

敏捷大数据流程11

代码检查和结对编程12

敏捷的场所:开发的效率13

协作空间14

私人空间14

个人空间14

用大幅打印件明确表达想法15

第2章 数据17

电子邮件17

处理原始数据18

原始的电子邮件18

结构化与半结构化数据18

SQL20

NoSQL24

序列化24

从演变的模式中抽取和展示特征25

数据流水线26

数据透视27

社交网络28

时间序列30

自然语言31

概率33

小结35

第3章 敏捷开发工具37

可扩展性=简洁37

敏捷大数据处理38

设置运行Python的虚拟环境39

使用Avro对事件进行序列化40

在Python中使用Avro40

收集数据42

使用Pig处理数据44

安装Pig45

使用MongoDB发布数据49

安装MongoDB49

安装MongoDB的Java驱动程序50

安装mongo-hadoop50

用Pig向MongoDB推送数据50

使用ElasticSearch搜索数据52

安装52

使用Wonderdog整合ElasticSearch和Pig53

对工作流程的反思55

轻量级的Web应用56

Python和Flask56

展示数据58

安装Bootstrap58

启用Bootstrap59

使用d3js和nvd3.js可视化数据63

小结64

第4章 在云端65

引言65

GitHub67

dotCloud67

dotCloud Echo服务68

Python工作者服务71

Amazon Web Services71

Simple Storage Service71

Elastic MapReduce72

MongoDB即服务79

辅助工具(Instrumentation)81

Google Analytics81

Mortar Data82

第2部分 登上金字塔85

第5章 收集和展示数据89

整合软件栈90

收集并序列化收件箱90

处理和发布邮件数据91

在浏览器中显示邮件93

用Flask和pymongo处理邮件数据94

使用Jinja2渲染HTML5页面94

敏捷检查点98

生成电子邮件清单99

用MongoDB显示邮件99

对数据展示的分析101

搜索邮件106

使用Pig,ElasticSearch和Wonderdog构建索引106

在网页中搜索邮件数据107

结论108

第6章 使用图表可视化数据111

优秀的图表112

抽取实体:邮件地址112

抽取邮件112

对时间进行可视化116

结论122

第7章 利用报表探索数据123

为数据添加联系126

用TF-IDF从邮件中提取关键字133

小结138

第8章 预测141

预测电子邮件的回复率142

个性化147

小结148

第9章 驱动行动149

好邮件的属性150

使用朴素贝叶斯方法进行更好的预测150

P(Reply|From ∩ To)150

P(Reply | Token)151

实时预测153

记录事件日志157

小结157

索引159

热门推荐