图书介绍

机器学习系统设计2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

机器学习系统设计
  • (美)里彻特,(美)科埃略著 著
  • 出版社: 北京:人民邮电出版社
  • ISBN:9787115356826
  • 出版时间:2014
  • 标注页数:210页
  • 文件大小:33MB
  • 文件页数:225页
  • 主题词:机器学习-系统设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

机器学习系统设计PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 Python机器学习入门1

1.1 梦之队:机器学习与Python1

1.2 这本书将教给你什么(以及不会教什么)2

1.3 遇到困难的时候怎么办3

1.4 开始4

1.4.1 NumPy、SciPy和Matplotlib简介4

1.4.2 安装Python5

1.4.3 使用NumPy和SciPy智能高效地处理数据5

1.4.4 学习NumPy5

1.4.5 学习SciPy9

1.5 我们第一个(极小的)机器学习应用10

1.5.1 读取数据10

1.5.2 预处理和清洗数据11

1.5.3 选择正确的模型和学习算法12

1.6 小结20

第2章 如何对真实样本分类22

2.1 Iris数据集22

2.1.1 第一步是可视化23

2.1.2 构建第一个分类模型24

2.2 构建更复杂的分类器28

2.3 更复杂的数据集和更复杂的分类器29

2.3.1 从Seeds数据集中学习29

2.3.2 特征和特征工程30

2.3.3 最邻近分类30

2.4 二分类和多分类33

2.5 小结34

第3章 聚类:寻找相关的帖子35

3.1 评估帖子的关联性35

3.1.1 不应该怎样36

3.1.2 应该怎样36

3.2 预处理:用相近的公共词语个数来衡量相似性37

3.2.1 将原始文本转化为词袋37

3.2.2 统计词语38

3.2.3 词语频次向量的归一化40

3.2.4 删除不重要的词语41

3.2.5 词干处理42

3.2.6 停用词兴奋剂44

3.2.7 我们的成果和目标45

3.3 聚类46

3.3.1 K均值46

3.3.2 让测试数据评估我们的想法49

3.3.3 对帖子聚类50

3.4 解决我们最初的难题51

3.5 调整参数54

3.6 小结54

第4章 主题模型55

4.1 潜在狄利克雷分配(LDA)55

4.2 在主题空间比较相似度59

4.3 选择主题个数64

4.4 小结65

第5章 分类:检测劣质答案67

5.1 路线图概述67

5.2 学习如何区分出优秀的答案68

5.2.1 调整样本68

5.2.2 调整分类器68

5.3 获取数据68

5.3.1 将数据消减到可处理的程度69

5.3.2 对属性进行预选择和处理70

5.3.3 定义什么是优质答案71

5.4 创建第一个分类器71

5.4.1 从k邻近(kNN)算法开始71

5.4.2 特征工程72

5.4.3 训练分类器73

5.4.4 评估分类器的性能74

5.4.5 设计更多的特征74

5.5 决定怎样提升效果77

5.5.1 偏差-方差及其折中77

5.5.2 解决高偏差78

5.5.3 解决高方差78

5.5.4 高偏差或低偏差78

5.6 采用逻辑回归81

5.6.1 一点数学和一个小例子81

5.6.2 在帖子分类问题上应用逻辑回归83

5.7 观察正确率的背后:准确率和召回率84

5.8 为分类器瘦身87

5.9 出货88

5.10 小结88

第6章 分类Ⅱ:情感分析89

6.1 路线图概述89

6.2 获取推特(Twitter)数据89

6.3 朴素贝叶斯分类器介绍90

6.3.1 了解贝叶斯定理90

6.3.2 朴素91

6.3.3 使用朴素贝叶斯进行分类92

6.3.4 考虑未出现的词语和其他古怪情况94

6.3.5 考虑算术下溢95

6.4 创建第一个分类器并调优97

6.4.1 先解决一个简单问题97

6.4.2 使用所有的类99

6.4.3 对分类器的参数进行调优101

6.5 清洗推文104

6.6 将词语类型考虑进去106

6.6.1 确定词语的类型106

6.6.2 用SentiWordNet成功地作弊108

6.6.3 我们第一个估算器110

6.6.4 把所有东西融合在一起111

6.7 小结112

第7章 回归:推荐113

7.1 用回归预测房价113

7.1.1 多维回归116

7.1.2 回归里的交叉验证116

7.2 惩罚式回归117

7.2.1 L1和L2惩罚117

7.2.2 在Scikit-learn中使用Lasso或弹性网118

7.3 P大于N的情形119

7.3.1 基于文本的例子120

7.3.2 巧妙地设置超参数(hyperparameter)121

7.3.3 评分预测和推荐122

7.4 小结126

第8章 回归:改进的推荐127

8.1 改进的推荐127

8.1.1 使用二值推荐矩阵127

8.1.2 审视电影的近邻129

8.1.3 组合多种方法130

8.2 购物篮分析132

8.2.1 获取有用的预测133

8.2.2 分析超市购物篮134

8.2.3 关联规则挖掘136

8.2.4 更多购物篮分析的高级话题137

8.3 小结138

第9章 分类Ⅲ:音乐体裁分类139

9.1 路线图概述139

9.2 获取音乐数据139

9.3 观察音乐140

9.4 用FFT构建第一个分类器143

9.4.1 增加实验敏捷性143

9.4.2 训练分类器144

9.4.3 在多分类问题中用混淆矩阵评估正确率144

9.4.4 另一种方式评估分类器效果:受试者工作特征曲线(ROC)146

9.5 用梅尔倒频谱系数(MFCC)提升分类效果148

9.6 小结152

第10章 计算机视觉:模式识别154

10.1 图像处理简介154

10.2 读取和显示图像155

10.2.1 图像处理基础156

10.2.2 加入椒盐噪声161

10.2.3 模式识别163

10.2.4 计算图像特征163

10.2.5 设计你自己的特征164

10.3 在更难的数据集上分类166

10.4 局部特征表示167

10.5 小结170

第11章 降维171

11.1 路线图171

11.2 选择特征172

11.2.1 用筛选器检测冗余特征172

11.2.2 用封装器让模型选择特征178

11.3 其他特征选择方法180

11.4 特征抽取181

11.4.1 主成分分析(PCA)181

11.4.2 PCA的局限性以及LDA会有什么帮助183

11.5 多维标度法(MDS)184

11.6 小结187

第12章 大数据188

12.1 了解大数据188

12.2 用Jug程序包把你的处理流程分解成几个任务189

12.2.1 关于任务189

12.2.2 复用部分结果191

12.2.3 幕后的工作原理192

12.2.4 用Jug分析数据192

12.3 使用亚马逊Web服务(AWS)194

12.3.1 构建你的第一台机器195

12.3.2 用starcluster自动创建集群199

12.4 小结202

附录A 更多机器学习知识203

A.1 在线资源203

A.2 参考书203

A.2.1 问答网站203

A.2.2 博客204

A.2.3 数据资源205

A.2.4 竞争日益加剧205

A.3 还剩下什么205

A.4 小结206

索引207

热门推荐