图书介绍

品味大数据 BIG DATA FOR DUMMIES2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

品味大数据 BIG DATA FOR DUMMIES
  • 张玉宏著 著
  • 出版社:
  • ISBN:
  • 出版时间:2016
  • 标注页数:0页
  • 文件大小:67MB
  • 文件页数:421页
  • 主题词:

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

品味大数据 BIG DATA FOR DUMMIESPDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一章 大数据简史漫谈之一——数字的来源及数据思维的发展2

1.1 人类的“数觉”与计数系统2

1.2 关于二进制的一点讨论7

1.3 数字的诞生与广泛应用的匹配法10

1.4 数学的“问世”与“算法”的祖师爷12

1.5 文字的“出炉”与罗马语言的来历14

1.6 古代的数据保存之道与文言文的“无奈”精简17

1.7 古代的“数据中心”——图书馆20

1.8 古代计算工具的诞生及其演变22

1.9 统计学诞生——数据思维的渐起29

1.10 美国式的人口普查——大数据催生新技术36

1.11 中国式的人口统计与数目字管理38

1.12 本章小结与思考42

第二章 大数据简史漫谈之二——近代存储体系发展中的那些人和事45

2.1 数据复制与传播中的问题及解决方案45

2.2 影响人类发展进程的几次能源革命47

2.3 不能遗忘的电气时代的传奇——特斯拉50

2.4 霍尔瑞斯的穿孔卡57

2.5 现代通用计算机的奠基者——图灵和冯·诺伊曼60

2.6 波弗劳姆的磁带发明64

2.7 华人王安电脑的磁芯存储器65

2.8 IBM的传奇磁存储世界68

2.9 网络存储世界的兴起71

2.10 本章小结与思考72

第三章 大数据简史漫谈之三——数据库的发展与大数据的兴起74

3.1 近代“数据中心”之梦殇74

3.2 “穷”则思变之网状数据库76

3.3 浓墨重彩之关系数据库78

3.4 突破数据共享封锁线的领头人83

3.5 高手对决的数据仓库领域两侠客85

3.6 向非结构化进发的数据大趋势87

3.7 大数据术语的历史渊源95

3.8 现代大数据的诞生97

3.9 在混沌和秩序转化中螺旋上升101

3.10 本章小结与思考102

第四章 大数据的内涵104

4.1 从数据、信息到知识、智慧的飞跃104

4.2 大数据的多版本定义108

4.3 大数据——新时代的生产资料111

4.4 信息(数据)化、第二经济与数据思维的转变114

4.5 大数据——来自学术界的青睐118

4.6 大数据——来自政府层面的重视119

4.7 大数据——来自工商业的热捧120

4.8 大数据内涵——“岂止于大”122

4.8.1 大数据之“大”有不同123

4.8.2 大数据之唯“快”不破126

4.8.3 大数据之五彩缤纷130

4.8.4 大数据之价“值”无限133

4.8.5 包括但不限于4V135

4.9 本章小结与思考137

第五章 大数据时代的一点哲学思考140

5.1 哲学与科学的关系——为什么计算机专业博士也发个哲学文凭(Ph.D)140

5.2 大、小数据的“质”不同143

5.3 大数据的数理哲学基础——同构关系146

5.4 大数据认识主体的变化——“替人消灾”式的认识能免责吗149

5.5 波普尔的世界3——秦始皇的长生梦,找错了空间151

5.6 大数据认识对象的变化——提升普罗大众的权重:“长尾理论”153

5.7 认识论对大数据研究的指导意义156

5.7.1 科学始于观察——证实主义156

5.7.2 证实主义的困顿——来自波普尔的批判158

5.7.3 科学始于问题——波普尔的贡献161

5.7.4 科学始于数据——大数据时代的科学转机与思考162

5.7.5 大数据的悲观思潮165

5.8 本章小结与思考166

第六章 大数据研究的第四范式167

6.1 谷歌公司的“不务正业”167

6.2 塞吉·布林的“秘密”病情169

6.3 布林病情的“治疗”方案171

6.4 詹姆斯·格雷的科学第四范式173

6.5 科学研究的其他三个范式175

6.6 本章小结与思考182

第七章 大数据,大有为184

7.1 洞察带来价值184

7.2 案例1:谷歌是如何“越俎代庖”地预测流感的186

7.2.1 流感治疗网络化186

7.2.2 “无意间”生产的搜索数据188

7.2.3 谷歌工程师们的杰作——流感预测趋势(GFT)188

7.2.4 谷歌的“越俎代庖”为何成功190

7.2.5 案例小结:数据、模型与理论191

7.3 案例2:“全数据”是如何为叶诗文抱不平的194

7.3.1 叶诗文事件的新闻背景194

7.3.2 什么是性能分析法195

7.3.3 质疑的合理性在哪里196

7.3.4 “大数据=全数据”的威力——为叶诗文抱不平198

7.3.5 案例小结200

7.4 案例3:大数据是如何对抗癌症的201

7.4.1 癌症大数据的特征是什么201

7.4.2 癌症从哪里来202

7.4.3 大数据用之于癌症斗争,挑战何在205

7.4.4 癌症诊疗的基础大数据——获取难205

7.4.5 数据化带来的颠覆式医疗——执行难205

7.4.6 哪些机构在用大数据对抗癌症206

7.4.7 癌症大数据的重要源头——基因组数据208

7.4.8 大数据对抗癌症,前景如何210

7.4.9 案例小结210

7.5 更多大数据应用案例211

7.6 本章小结与思考215

第八章 大数据之坑与小数据之美219

8.1 引子——哪个V才是大数据最重要的特征219

8.1.1 “大”有不同——Volume(大量)219

8.1.2 数据共征——Velocity(快速)与Value(价值)220

8.1.3 五彩缤“纷”——Variety(多样)221

8.2 大数据的力量与陷阱223

8.2.1 大数据的力量223

8.2.2 大数据的陷阱224

8.2.3 今日王谢堂前燕,暂未飞入百姓家——大数据还没那么普及229

8.2.4 你若安好,便是晴天——小数据之美232

8.3 本章小结与思考235

第九章 12个小故事,思考大数据238

9.1 故事1:大数据都是骗人的啊——大数据预测得准吗238

9.2 故事2:颠簸的街道——对不起,“n=all”只是一个幻觉240

9.3 故事3:醉汉路灯下找钥匙——大数据的研究方法可笑吗241

9.4 故事4:园中有金不在金——大数据的价值242

9.5 故事5:盖洛普抽样的成功——大小之争,“大”数据一定胜过243

小抽样吗243

9.6 故事6:点球成金——数据流PK球探,谁更重要245

9.7 故事7:啤酒和尿布——经典故事是伪造的,你知道吗246

9.8 故事8:谷歌流感预测——预测是如何失效的248

9.9 故事9:Target超市预测女孩怀孕——“大数据”智慧,还是愚蠢250

9.10 故事10:你的一夜情我知道——大数据的隐私之痛252

9.11 故事11:大数据,无须惧——比萨店员更能知道顾客所有的信息吗254

9.12 故事12:扑朔离迷的“因果关系”——苏格拉底的“诡辩术”259

9.13 本章小结与思考262

第十章 大数据技术漫谈——需要读懂的103篇大数据文献263

10.1 大数据价值的实现263

10.2 大数据分析的关键架构层264

10.3 架构的演进267

10.4 几个重要的概念273

10.5 文件系统层288

10.6 数据存储层297

10.7 资源管理器层304

10.8 调度器305

10.9 协调器306

10.10 计算框架308

10.11 数据分析层321

10.12 数据集成层323

10.13 操作框架层326

10.14 本章小结与思考327

第十一章 牛刀小试之Hadoop实战329

11.1 什么是Hadoop329

11.2 Hadoop发展历程329

11.3 Hadoop集群服务器的安装与配置332

11.3.1 安装CentOS 7333

11.3.2 配置Java环境336

11.3.3 启动和配置SSH服务344

11.3.4 安装Hadoop351

11.3.5 启动Hadoop360

11.4 运行Hello World版Hadoop程序——WordCount362

11.5 全分布模式下的Hadoop集群构建366

11.5.1 Linux以运行等级3启动366

11.5.2 在Windows和Mac OS环境下克隆虚拟机369

11.5.3 设置静态IP地址372

11.5.4 修改hosts文件377

11.5.5 虚拟机的同步配置379

11.5.6 SSH的免密码登录380

11.5.7 全分布模式下安装Hadoop382

11.5.8 同步配置文件387

11.5.9 创建所需目录389

11.5.10 关闭防火墙390

11.5.11 格式化文件系统390

11.5.12 启动Hadoop守护进程391

11.5.13 验证全分布模式393

11.5.14 默认配置文件所在位置395

11.5.15 关闭Hadoop396

11.5.16 Hadoop的运行错误查找396

11.6 WordCount代码详解397

11.6.1 MapReduce编程模型397

11.6.2 WordCount的MapReduce处理流程398

11.6.3 WordCount源码解读399

11.7 本章小结与思考405

热门推荐