图书介绍
机器学习与R语言实战2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- 丘祐玮(Yu.Wei Chiu)著 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111535959
- 出版时间:2016
- 标注页数:338页
- 文件大小:31MB
- 文件页数:355页
- 主题词:机器学习;程序语言-程序设计
PDF下载
下载说明
机器学习与R语言实战PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 基于R实践机器学习1
1.1 简介1
1.2 下载和安装R3
1.3 下载和安装RStudio10
1.4 包的安装和加载13
1.5 数据读写15
1.6 使用R实现数据操作18
1.7 应用简单统计22
1.8 数据可视化25
1.9 获取用于机器学习的数据集28
第2章 挖掘RMS Titanic数据集32
2.1 简介32
2.2 从CSV文件中读取Titanic数据集33
2.3 根据数据类型进行转换36
2.4 检测缺失值38
2.5 插补缺失值40
2.6 识别和可视化数据43
2.7 基于决策树预测获救乘客50
2.8 基于混淆矩阵验证预测结果的准确性53
2.9 使用ROC曲线评估性能55
第3章 R和统计58
3.1 简介58
3.2 理解R中的数据采样59
3.3 在R中控制概率分布59
3.4 在R中进行一元描述统计64
3.5 在R中进行多元相关分析67
3.6 进行多元线性回归分析69
3.7 执行二项分布检验71
3.8 执行t检验73
3.9 执行Kolmogorov-Smirnov检验76
3.10 理解Wilcoxon秩和检验及Wilcoxon符号秩检验78
3.11 实施皮尔森卡方检验80
3.12 进行单因素方差分析82
3.13 进行双因素方差分析85
第4章 理解回归分析90
4.1 简介90
4.2 调用lm函数构建线性回归模型90
4.3 输出线性模型的特征信息93
4.4 使用线性回归模型预测未知值94
4.5 生成模型的诊断图96
4.6 利用lm函数生成多项式回归模型98
4.7 调用rlm函数生成稳健线性回归模型99
4.8 在SLID数据集上研究线性回归案例101
4.9 基于高斯模型的广义线性回归107
4.10 基于泊松模型的广义线性回归109
4.11 基于二项模型的广义线性回归111
4.12 利用广义加性模型处理数据112
4.13 可视化广义加性模型114
4.14 诊断广义加性模型116
第5章 分类Ⅰ——树、延迟和概率119
5.1 简介119
5.2 准备训练和测试数据集119
5.3 使用递归分割树建立分类模型121
5.4 递归分割树可视化124
5.5 评测递归分割树的预测能力126
5.6 递归分割树剪枝128
5.7 使用条件推理树建立分类模型130
5.8 条件推理树可视化131
5.9 评测条件推理树的预测能力132
5.10 使用k近邻分类算法134
5.11 使用逻辑回归分类算法137
5.12 使用朴素贝叶斯分类算法142
第6章 分类Ⅱ——神经网络和SVM146
6.1 简介146
6.2 使用支持向量机完成数据分类147
6.3 选择支持向量机的惩罚因子149
6.4 实现SVM模型的可视化152
6.5 基于支持向量机训练模型实现类预测154
6.6 调整支持向量机157
6.7 利用neuralnet包训练神经网络模型161
6.8 可视化由neuralnet包得到的神经网络模型164
6.9 基于neuralnet包得到的模型实现类标号预测166
6.10 利用nnet包训练神经网络模型168
6.11 基于nnet包得到的模型实现类标号预测170
第7章 模型评估173
7.1 简介173
7.2 基于k折交叉验证方法评测模型性能173
7.3 利用e1071包完成交叉验证175
7.4 利用caret包完成交叉检验176
7.5 利用caret包对变量重要程度排序177
7.6 利用rminer包对变量重要程度排序180
7.7 利用caret包找到高度关联的特征181
7.8 利用caret包选择特征182
7.9 评测回归模型的性能187
7.10 利用混淆矩阵评测模型的预测能力189
7.11 利用ROCR评测模型的预测能力191
7.12 利用caret包比较ROC曲线193
7.13 利用caret包比较模型性能差异196
第8章 集成学习199
8.1 简介199
8.2 使用bagging方法对数据分类200
8.3 基于bagging方法进行交叉验证203
8.4 使用boosting方法对数据分类204
8.5 基于boosting方法进行交叉验证207
8.6 使用gradient boosting方法对数据分类208
8.7 计算分类器边缘213
8.8 计算集成分类算法的误差演变216
8.9 使用随机森林方法对数据分类218
8.10 估算不同分类器的预测误差223
第9章 聚类226
9.1 简介226
9.2 使用层次聚类处理数据227
9.3 将树分成簇231
9.4 使用k均值方法处理数据234
9.5 绘制二元聚类图237
9.6 聚类算法比较239
9.7 从簇中抽取轮廓信息241
9.8 获得优化的k均值聚类242
9.9 使用密度聚类方法处理数据244
9.10 使用基于模型的聚类方法处理数据248
9.11 相异度矩阵的可视化251
9.12 使用外部验证评估聚类效果253
第10章 关联分析和序列挖掘256
10.1 简介256
10.2 将数据转换成事务数据257
10.3 展示事务及关联258
10.4 使用Apriori规则完成关联挖掘261
10.5 去掉冗余规则266
10.6 关联规则的可视化267
10.7 使用Eclat挖掘频繁项集270
10.8 生成时态事务数据273
10.9 使用cSPADE挖掘频繁时序模式276
第11章 降维279
11.1 简介279
11.2 使用FSelector完成特征筛选280
11.3 使用PCA进行降维283
11.4 使用scree测试确定主成分数287
11.5 使用Kaiser方法确定主成分数289
11.6 使用主成分分析散点图可视化多元变量290
11.7 使用MDS进行降维293
11.8 使用SVD进行降维297
11.9 使用SVD进行图像压缩299
11.10 使用ISOMAP进行非线性降维302
11.11 使用局部线性嵌入法进行非线性降维306
第12章 大数据分析(R和Hadoop)310
12.1 简介310
12.2 准备RHadoop环境311
12.3 安装rmr2314
12.4 安装rhdfs315
12.5 在rhdfs中操作HDFS316
12.6 在RHadoop中解决单词计数问题318
12.7 比较R MapReduce程序和标准R程序的性能差别320
12.8 测试和调试rmr2程序321
12.9 安装plyrmr323
12.10 使用plyrmr处理数据324
12.11 在RHadoop中实施机器学习327
12.12 在Amazon EMR环境中配置RHadoop机群330
附录A R和机器学习的资源335
附录B Titanic幸存者的数据集337
热门推荐
- 630862.html
- 619630.html
- 3017063.html
- 2932596.html
- 2899369.html
- 1632579.html
- 205042.html
- 1061960.html
- 3380401.html
- 2422782.html
- http://www.ickdjs.cc/book_961584.html
- http://www.ickdjs.cc/book_1509349.html
- http://www.ickdjs.cc/book_37674.html
- http://www.ickdjs.cc/book_1857535.html
- http://www.ickdjs.cc/book_3293781.html
- http://www.ickdjs.cc/book_1688491.html
- http://www.ickdjs.cc/book_2829897.html
- http://www.ickdjs.cc/book_1644624.html
- http://www.ickdjs.cc/book_3471098.html
- http://www.ickdjs.cc/book_2816426.html