图书介绍

大数据挖掘2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

大数据挖掘
  • 熊赟,朱扬勇,陈志渊编著 著
  • 出版社: 上海:上海科学技术出版社
  • ISBN:9787547829615
  • 出版时间:2016
  • 标注页数:300页
  • 文件大小:35MB
  • 文件页数:317页
  • 主题词:数据采集

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

大数据挖掘PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论1

1.1 理解大数据挖掘2

1.1.1 大数据挖掘的定义2

1.1.2 大数据挖掘的任务4

1.1.3 大数据挖掘的特点5

1.1.4 大数据挖掘与相关技术的差异7

1.2 大数据挖掘的相关技术10

1.2.1 大数据获取10

1.2.2 大数据存储与管理11

1.2.3 大数据可视化13

1.3 小结14

参考文献14

第2章 大数据计算框架17

2.1 HDFS18

2.2 MapReduce19

2.2.1 MapReduce框架及范例19

2.2.2 MapReduce存在的问题和解决方法21

2.3 NoSQL(非关系型)数据库22

2.3.1 NoSQL数据库的分类22

2.3.2 NoSQL数据库实例23

2.4 SQL(关系型)数据库25

2.4.1 Apache HIVE25

2.4.2 其他SQL数据库29

2.5 小结30

参考文献30

第3章 关联分析31

3.1 关联分析的基本概念32

3.1.1 关联分析的定义32

3.1.2 关联规则的定义32

3.1.3 关联规则的分类37

3.2 关联规则挖掘的原理38

3.2.1 挖掘简单关联规则40

3.2.2 挖掘量化关联规则46

3.2.3 挖掘多层关联规则50

3.2.4 挖掘多维关联规则53

3.3 关联规则挖掘的基础算法54

3.3.1 Apriori算法54

3.3.2 Apriori算法的优化56

3.3.3 FP-Growth算法57

3.3.4 序列模式挖掘算法63

3.4 挖掘算法的进阶方法80

3.4.1 USpan:高效用序列模式挖掘算法80

3.4.2 HusMaR:基于MapReduce的序列模式挖掘算法82

3.5 小结86

参考文献87

第4章 聚类分析89

4.1 聚类分析的基本概念90

4.1.1 簇与聚类91

4.1.2 相似性度量和聚类原理93

4.2 聚类分析的基础算法103

4.2.1 层次的方法——单连接算法、BIRCH算法103

4.2.2 划分的方法——k-means和k-medoids算法112

4.2.3 基于密度的方法——OPTICS算法117

4.3 聚类分析的进阶方法123

4.3.1 Density Peaks算法(AA算法)123

4.3.2 k-meansⅡ:基于MapReduce的k-means算法127

4.4 小结130

参考文献130

第5章 分类分析133

5.1 分类分析的基本概念134

5.2 分类模型135

5.3 分类分析的原理135

5.3.1 决策树135

5.3.2 基于统计的方法141

5.3.3 基于神经网络的方法146

5.4 分类分析的基础算法148

5.4.1 ID3和C4.5 算法:基于决策树的分类算法148

5.4.2 SLIQ:一种高速可伸缩的基于决策树的分类算法155

5.4.3 后向传播算法BP算法:基于神经网络的分类算法165

5.5 分类分析的进阶方法172

5.6 小结174

参考文献174

第6章 异常分析177

6.1 异常分析的基本概念178

6.1.1 异常178

6.1.2 异常分析178

6.2 异常分析的原理179

6.2.1 基于统计的异常分析方法179

6.2.2 基于偏差的异常分析方法179

6.2.3 基于距离的异常分析方法181

6.2.4 基于密度的异常分析方法181

6.3 异常分析的主要算法181

6.3.1 基于距离的异常分析算法181

6.3.2 基于密度的异常分析算法193

6.4 小结202

参考文献202

第7章 特异群组挖掘205

7.1 特异群组挖掘的基本概念206

7.2 特异群组挖掘与聚类和异常检测的关系207

7.3 特异群组挖掘形式化描述208

7.4 特异群组挖掘框架算法210

7.5 特异群组挖掘应用211

7.6 小结215

参考文献216

第8章 演变分析219

8.1 演变分析的基本概念220

8.2 演变分析的原理221

8.3 演变分析的基础算法240

8.4 演变分析的进阶算法245

8.4.1 时间序列随机偏移符号化表示算法245

8.4.2 多维温度序列协同异常事件挖掘算法253

8.5 小结259

参考文献259

第9章 异质数据网络挖掘261

9.1 异质数据网络262

9.2 异质数据网络挖掘研究现状266

9.3 数据网络上的相似性度量的研究267

9.4 异质数据网络挖掘研究内容267

9.5 小结269

参考文献270

第10章 大数据挖掘应用之推荐系统273

10.1 推荐系统研究阶段274

10.2 推荐系统算法276

10.2.1 推荐系统定义276

10.2.2 推荐算法分类277

10.2.3 比较与分析282

10.3 推荐系统的评测283

10.4 小结284

参考文献285

第11章 大数据中的隐私问题291

11.1 隐私的重要性292

11.2 隐私保护技术294

11.2.1 直接攻击的应对方法295

11.2.2 间接攻击的应对方法296

11.3 小结299

参考文献300

热门推荐