图书介绍

R语言与数据挖掘最佳实践和经典案例2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

R语言与数据挖掘最佳实践和经典案例
  • (澳)YANCHANGZHAO著;陈健,黄琰译 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111475415
  • 出版时间:2014
  • 标注页数:205页
  • 文件大小:21MB
  • 文件页数:219页
  • 主题词:程序语言-程序设计;数据采集

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

R语言与数据挖掘最佳实践和经典案例PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 简介1

1.1 数据挖掘1

1.2 R1

1.3 数据集2

1.3.1 iris数据集2

1.3.2 bodyfat数据集3

第2章 数据的导入与导出4

2.1 R数据的保存与加载4

2.2 CSV文件的导入与导出4

2.3 从SAS中导入数据5

2.4 通过ODBC导入与导出数据6

2.4.1 从数据库中读取数据7

2.4.2 从Excel文件中导入与导出数据7

第3章 数据探索8

3.1 查看数据8

3.2 探索单个变量10

3.3 探索多个变量12

3.4 更多探索15

3.5 将图表保存到文件中19

第4章 决策树与随机森林21

4.1 使用party包构建决策树21

4.2 使用rpart包构建决策树24

4.3 随机森林29

第5章 回归分析33

5.1 线性回归33

5.2 逻辑回归38

5.3 广义线性回归38

5.4 非线性回归40

第6章 聚类41

6.1 k-means聚类41

6.2 k-medoids聚类43

6.3 层次聚类45

6.4 基于密度的聚类46

第7章 离群点检测50

7.1 单变量的离群点检测50

7.2 局部离群点因子检测53

7.3 用聚类方法进行离群点检测56

7.4 时间序列数据的离群点检测58

7.5 讨论59

第8章 时间序列分析与挖掘60

8.1 R中的时间序列数据60

8.2 时间序列分解60

8.3 时间序列预测62

8.4 时间序列聚类63

8.4.1 动态时间规整63

8.4.2 合成控制图的时间序列数据64

8.4.3 基于欧氏距离的层次聚类65

8.4.4 基于DTW距离的层次聚类66

8.5 时间序列分类67

8.5.1 基于原始数据的分类67

8.5.2 基于特征提取的分类68

8.5.3 k-NN分类69

8.6 讨论70

8.7 延伸阅读70

第9章 关联规则71

9.1 关联规则的基本概念71

9.2 Titanic数据集71

9.3 关联规则挖掘73

9.4 消除冗余78

9.5 解释规则79

9.6 关联规则的可视化80

9.7 讨论与延伸阅读82

第10章 文本挖掘84

10.1 Twitter的文本检索84

10.2 转换文本85

10.3 提取词干86

10.4 建立词项-文档矩阵88

10.5 频繁词项与关联90

10.6 词云91

10.7 词项聚类92

10.8 推文聚类94

10.8.1 基于k-means算法的推文聚类94

10.8.2 基于k-medoids算法的推文聚类96

10.9 程序包、延伸阅读与讨论98

第11章 社交网络分析99

11.1 词项网络99

11.2 推文网络102

11.3 双模式网络107

11.4 讨论与延伸阅读110

第12章 案例Ⅰ:房价指数的分析与预测111

12.1 HPI数据导入111

12.2 HPI数据探索112

12.3 HPI趋势与季节性成分118

12.4 HPI预测120

12.5 房地产估价122

12.6 讨论122

第13章 案例Ⅱ:客户回复预测与效益最大化123

13.1 简介123

13.2 KDD Cup 1998的数据123

13.3 数据探索131

13.4 训练决策树137

13.5 模型评估140

13.6 选择最优决策树143

13.7 评分145

13.8 讨论与总结148

第14章 案例Ⅲ:内存受限的大数据预测模型150

14.1 简介150

14.2 研究方法150

14.3 数据与变量151

14.4 随机森林152

14.5 内存问题153

14.6 样本数据的训练模型154

14.7 使用已选变量建立模型156

14.8 评分162

14.9 输出规则168

14.9.1 以文本格式输出规则168

14.9.2 输出SAS规则的得分172

14.10 总结与讨论177

第15章 在线资源178

15.1 R参考文档178

15.2 R178

15.3 数据挖掘179

15.4 R的数据挖掘180

15.5 R的分类与预测181

15.6 R的时间序列分析181

15.7 R的关联规则挖掘181

15.8 R的空间数据分析181

15.9 R的文本挖掘182

15.10 R的社交网络分析182

15.11 R的数据清洗与转换182

15.12 R的大数据与并行计算182

R语言数据挖掘参考文档184

参考资料197

通用索引201

包索引203

函数索引204

热门推荐