图书介绍
Python 网络数据爬取及分析从入门到精通 分析篇2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- 杨秀璋,颜娜编著 著
- 出版社: 北京:北京航空航天大学出版社
- ISBN:9787512427136
- 出版时间:2018
- 标注页数:248页
- 文件大小:21MB
- 文件页数:265页
- 主题词:软件工具-程序设计
PDF下载
下载说明
Python 网络数据爬取及分析从入门到精通 分析篇PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 网络数据分析概述1
1.1 数据分析1
1.2 相关技术3
1.3 Anaconda开发环境5
1.4 常用数据集9
1.4.1 Sklearn数据集9
1.4.2 UCI数据集10
1.4.3 自定义爬虫数据集11
1.4.4 其他数据集12
1.5 本章小结13
参考文献14
第2章 Python数据分析常用库15
2.1 常用库15
2.2 NumPy17
2.2.1 Array用法17
2.2.2 二维数组操作19
2.3 Pandas21
2.3.1 读/写文件22
2.3.2 Series24
2.3.3 DataFrame26
2.4 Matplotlib26
2.4.1 基础用法27
2.4.2 绘图简单示例28
2.5 Sklearn31
2.6 本章小结32
参考文献32
第3章 Python可视化分析33
3.1 Matplotlib可视化分析33
3.1.1 绘制曲线图33
3.1.2 绘制散点图37
3.1.3 绘制柱状图40
3.1.4 绘制饼状图42
3.1.5 绘制3D图形43
3.2 Pandas读取文件可视化分析45
3.2.1 绘制折线对比图45
3.2.2 绘制柱状图和直方图48
3.2.3 绘制箱图51
3.3 ECharts可视化技术初识53
3.4 本章小结57
参考文献57
第4章 Python回归分析58
4.1 回归58
4.1.1 什么是回归58
4.1.2 线性回归59
4.2 线性回归分析60
4.2.1 LinearRegression61
4.2.2 用线性回归预测糖尿病63
4.3 多项式回归分析68
4.3.1 基础概念68
4.3.2 PolynomialFeatures69
4.3.3 用多项式回归预测成本和利润70
4.4 逻辑回归分析73
4.4.1 LogisticRegression75
4.4.2 鸢尾花数据集回归分析实例75
4.5 本章小结83
参考文献83
第5章 Python聚类分析85
5.1 聚类85
5.1.1 算法模型85
5.1.2 常见聚类算法86
5.1.3 性能评估88
5.2 K-Means90
5.2.1 算法描述90
5.2.2 用K-Means分析篮球数据96
5.2.3 K-Means聚类优化99
5.2.4 设置类簇中心103
5.3 BIRCH105
5.3.1 算法描述105
5.3.2 用BIRCH分析氧化物数据106
5.4 降维处理110
5.4.1 PCA降维111
5.4.2 Sklearn PCA降维111
5.4.3 PCA降维实例113
5.5 本章小结117
参考文献118
第6章 Python分类分析119
6.1 分类119
6.1.1 分类模型119
6.1.2 常见分类算法120
6.1.3 回归、聚类和分类的区别122
6.1.4 性能评估123
6.2 决策树123
6.2.1 算法实例描述123
6.2.2 DTC算法125
6.2.3 用决策树分析鸢尾花126
6.2.4 数据集划分及分类评估128
6.2.5 区域划分对比132
6.3 KNN分类算法136
6.3.1 算法实例描述136
6.3.2 KNeighborsClassifier138
6.3.3 用KNN分类算法分析红酒类型139
6.4 SVM分类算法147
6.4.1 SVM分类算法的基础知识147
6.4.2 用SVM分类算法分析红酒数据148
6.4.3 用优化SVM分类算法分析红酒数据集151
6.5 本章小结154
参考文献154
第7章 Python关联规则挖掘分析156
7.1 基本概念156
7.1.1 关联规则156
7.1.2 置信度与支持度157
7.1.3 频繁项集158
7.2 Apriori算法159
7.3 Apriori算法的实现163
7.4 本章小结167
参考文献167
第8章 Python数据预处理及文本聚类168
8.1 数据预处理概述168
8.2 中文分词170
8.2.1 中文分词技术170
8.2.2 Jieba中文分词工具171
8.3 数据清洗175
8.3.1 概述175
8.3.2 中文语料清洗176
8.4 特征提取及向量空间模型179
8.4.1 特征规约179
8.4.2 向量空间模型181
8.4.3 余弦相似度计算182
8.5 权重计算184
8.5.1 常用权重计算方法184
8.5.2 TF-IDF185
8.5.3 用Sklearn计算TF-IDF186
8.6 文本聚类188
8.7 本章小结192
参考文献192
第9章 Python词云热点与主题分布分析193
9.1 词云193
9.2 WordCloud的安装及基本用法194
9.2.1 WordCloud的安装194
9.2.2 WordCloud的基本用法195
9.3 LDA203
9.3.1 LDA的安装过程203
9.3.2 LDA的基本用法及实例204
9.4 本章小结214
参考文献214
第10章 复杂网络与基于数据库技术的分析215
10.1 复杂网络215
10.1.1 复杂网络和知识图谱215
10.1.2 NetworkX217
10.1.3 用复杂网络分析学生关系网219
10.2 基于数据库技术的数据分析224
10.2.1 数据准备224
10.2.2 基于数据库技术的可视化分析225
10.2.3 基于数据库技术的可视化对比232
10.3 基于数据库技术的博客行为分析234
10.3.1 幂率分布234
10.3.2 用幂率分布分析博客数据集235
10.4 本章小结245
参考文献245
套书后记246
致谢248
热门推荐
- 1943629.html
- 2926886.html
- 2017028.html
- 2391467.html
- 1814876.html
- 3135048.html
- 494070.html
- 37577.html
- 2479001.html
- 2339575.html
- http://www.ickdjs.cc/book_2769677.html
- http://www.ickdjs.cc/book_477238.html
- http://www.ickdjs.cc/book_2574444.html
- http://www.ickdjs.cc/book_2470634.html
- http://www.ickdjs.cc/book_479849.html
- http://www.ickdjs.cc/book_3650708.html
- http://www.ickdjs.cc/book_869467.html
- http://www.ickdjs.cc/book_3824183.html
- http://www.ickdjs.cc/book_3470166.html
- http://www.ickdjs.cc/book_3181473.html