图书介绍
Python自然语言处理实战 核心技术与算法2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- 涂铭,刘祥,刘树春著 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111597674
- 出版时间:2018
- 标注页数:284页
- 文件大小:120MB
- 文件页数:289页
- 主题词:软件工具-自然语言处理-教材
PDF下载
下载说明
Python自然语言处理实战 核心技术与算法PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 NLP基础1
1.1 什么是NLP1
1.1.1 NLP的概念1
1.1.2 NLP的研究任务3
1.2 NLP的发展历程5
1.3 NLP相关知识的构成7
1.3.1 基本术语7
1.3.2 知识结构9
1.4 语料库10
1.5 探讨NLP的几个层面11
1.6 NLP与人工智能13
1.7 本章小结15
第2章 NLP前置技术解析16
2.1 搭建Python开发环境16
2.1.1 Python的科学计算发行版——Anaconda17
2.1.2 Anaconda的下载与安装19
2.2 正则表达式在NLP的基本应用21
2.2.1 匹配字符串22
2.2.2 使用转义符26
2.2.3 抽取文本中的数字26
2.3 Numpy使用详解27
2.3.1 创建数组28
2.3.2 获取Numpy中数组的维度30
2.3.3 获取本地数据31
2.3.4 正确读取数据32
2.3.5 Numpy数组索引32
2.3.6 切片33
2.3.7 数组比较33
2.3.8 替代值34
2.3.9 数据类型转换36
2.3.10 Numpy的统计计算方法36
2.4 本章小结37
第3章 中文分词技术38
3.1 中文分词简介38
3.2 规则分词39
3.2.1 正向最大匹配法39
3.2.2 逆向最大匹配法41
3.2.3 双向最大匹配法42
3.3 统计分词43
3.3.1 语言模型44
3.3.2 HMM模型45
3.3.3 其他统计分词算法52
3.4 混合分词52
3.5 中文分词工具——Jieba53
3.5.1 Jieba的三种分词模式54
3.5.2 实战之高频词提取55
3.6 本章小结58
第4章 词性标注与命名实体识别59
4.1 词性标注59
4.1.1 词性标注简介59
4.1.2 词性标注规范60
4.1.3 Jieba分词中的词性标注61
4.2 命名实体识别63
4.2.1 命名实体识别简介63
4.2.2 基于条件随机场的命名实体识别65
4.2.3 实战一:日期识别69
4.2.4 实战二:地名识别75
4.3 总结84
第5章 关键词提取算法85
5.1 关键词提取技术概述85
5.2 关键词提取算法TF/IDF算法86
5.3 TextRank算法88
5.4 LSA/LSI/LDA算法91
5.4.1 LSA/LSI算法93
5.4.2 LDA算法94
5.5 实战提取文本关键词95
5.6 本章小结105
第6章 句法分析106
6.1 句法分析概述106
6.2 句法分析的数据集与评测方法107
6.2.1 句法分析的数据集108
6.2.2 句法分析的评测方法109
6.3 句法分析的常用方法109
6.3.1 基于PCFG的句法分析110
6.3.2 基于最大间隔马尔可夫网络的句法分析112
6.3.3 基于CRF的句法分析113
6.3.4 基于移进-归约的句法分析模型113
6.4 使用Stanford Parser的PCFG算法进行句法分析115
6.4.1 Stanford Parser115
6.4.2 基于PCFG的中文句法分析实战116
6.5 本章小结119
第7章 文本向量化120
7.1 文本向量化概述120
7.2 向量化算法word2vec121
7.2.1 神经网络语言模型122
7.2.2 C&W模型124
7.2.3 CBOW模型和Skip-gram模型125
7.3 向量化算法doc2vec/str2vec127
7.4 案例:将网页文本向量化129
7.4.1 词向量的训练129
7.4.2 段落向量的训练133
7.4.3 利用word2vec和doc2vec计算网页相似度134
7.5 本章小结139
第8章 情感分析技术140
8.1 情感分析的应用141
8.2 情感分析的基本方法142
8.2.1 词法分析143
8.2.2 机器学习方法144
8.2.3 混合分析144
8.3 实战电影评论情感分析145
8.3.1 卷积神经网络146
8.3.2 循环神经网络147
8.3.3 长短时记忆网络148
8.3.4 载入数据150
8.3.5 辅助函数154
8.3.6 模型设置155
8.3.7 调参配置158
8.3.8 训练过程159
8.4 本章小结159
第9章 NLP中用到的机器学习算法160
9.1 简介160
9.1.1 机器学习训练的要素161
9.1.2 机器学习的组成部分162
9.2 几种常用的机器学习方法166
9.2.1 文本分类166
9.2.2 特征提取168
9.2.3 标注169
9.2.4 搜索与排序170
9.2.5 推荐系统170
9.2.6 序列学习172
9.3 分类器方法173
9.3.1 朴素贝叶斯NaiveBayesian173
9.3.2 逻辑回归174
9.3.3 支持向量机175
9.4 无监督学习的文本聚类177
9.5 文本分类实战:中文垃圾邮件分类180
9.5.1 实现代码180
9.5.2 评价指标187
9.6 文本聚类实战:用K-means对豆瓣读书数据聚类190
9.7 本章小结194
第10章 基于深度学习的NLP算法195
10.1 深度学习概述195
10.1.1 神经元模型196
10.1.2 激活函数197
10.1.3 感知机与多层网络198
10.2 神经网络模型201
10.3 多输出层模型203
10.4 反向传播算法204
10.5 最优化算法208
10.5.1 梯度下降208
10.5.2 随机梯度下降209
10.5.3 批量梯度下降210
10.6 丢弃法211
10.7 激活函数211
10.7.1 tanh函数212
10.7.2 ReLU函数212
10.8 实现BP算法213
10.9 词嵌入算法216
10.9.1 词向量217
10.9.2 word2vec简介217
10.9.3 词向量模型220
10.9.4 CBOW和Skip-gram模型222
10.10 训练词向量实践224
10.11 朴素Vanilla-RNN227
10.12 LSTM网络230
10.12.1 LSTM基本结构230
10.12.2 其他LSTM变种形式234
10.13 Attention机制236
10.13.1 文本翻译237
10.13.2 图说模型237
10.13.3 语音识别239
10.13.4 文本摘要239
10.14 Seq2Seq模型240
10.15 图说模型242
10.16 深度学习平台244
10.16.1 Tensorflow245
10.16.2 Mxnet246
10.16.3 PyTorch246
10.16.4 Caffe247
10.16.5 Theano247
10.17 实战Seq2Seq问答机器人248
10.18 本章小结254
第11章 Solr搜索引擎256
11.1 全文检索的原理257
11.2 Solr简介与部署258
11.3 Solr后台管理描述263
11.4 配置schema267
11.5 Solr管理索引库270
11.5.1 创建索引270
11.5.2 查询索引276
11.5.3 删除文档279
11.6 本章小结281
热门推荐
- 3494051.html
- 3823340.html
- 970443.html
- 2865348.html
- 1111078.html
- 763549.html
- 2689197.html
- 2714652.html
- 2345504.html
- 3380539.html
- http://www.ickdjs.cc/book_2288880.html
- http://www.ickdjs.cc/book_592583.html
- http://www.ickdjs.cc/book_2115502.html
- http://www.ickdjs.cc/book_2354407.html
- http://www.ickdjs.cc/book_1158506.html
- http://www.ickdjs.cc/book_599636.html
- http://www.ickdjs.cc/book_3667061.html
- http://www.ickdjs.cc/book_511748.html
- http://www.ickdjs.cc/book_2837564.html
- http://www.ickdjs.cc/book_1971633.html