图书介绍
自然语言处理原理与技术实现2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- 罗刚,张子宪编著 著
- 出版社: 北京:电子工业出版社
- ISBN:9787121286209
- 出版时间:2016
- 标注页数:432页
- 文件大小:56MB
- 文件页数:446页
- 主题词:自然语言处理
PDF下载
下载说明
自然语言处理原理与技术实现PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 应用自然语言处理技术1
1.1 付出与回报2
1.1.1 如何开始2
1.1.2 招聘人员2
1.1.3 学习3
1.2 开发环境3
1.3 技术基础4
1.3.1 Java4
1.3.2 规则方法5
1.3.3 统计方法5
1.3.4 计算框架5
1.3.5 文本挖掘7
1.3.6 语义库7
1.4 本章小结9
1.5 专业术语9
第2章 中文分词原理与实现11
2.1 接口12
2.1.1 切分方案13
2.1.2 词特征13
2.2 查找词典算法13
2.2.1标准Trie树14
2.2.2 三叉Trie树18
2.2.3 词典格式26
2.3 最长匹配中文分词27
2.3.1 正向最大长度匹配法28
2.3.2 逆向最大长度匹配法33
2.3.3 处理未登录串39
2.3.4 开发分词43
2.4 概率语言模型的分词方法45
2.4.1 一元模型47
2.4.2 整合基于规则的方法54
2.4.3 表示切分词图55
2.4.4 形成切分词图62
2.4.5 数据基础64
2.4.6 改进一元模型75
2.4.7 二元词典79
2.4.8 完全二叉树组85
2.4.9 三元词典89
2.4.10 N元模型90
2.4.11 N元分词91
2.4.12 生成语言模型99
2.4.13 评估语言模型100
2.4.14 概率分词的流程与结构101
2.4.15 可变长N元分词102
2.4.16 条件随机场103
2.5 新词发现103
2.5.1 成词规则109
2.6 词性标注109
2.6.1 数据基础114
2.6.2 隐马尔可夫模型115
2.6.3 存储数据124
2.6.4 统计数据131
2.6.5 整合切分与词性标注133
2.6.6 大词表138
2.6.7 词性序列138
2.6.8 基于转换的错误学习方法138
2.6.9 条件随机场141
2.7 词类模型142
2.8 未登录词识别144
2.8.1 未登录人名144
2.8.2 提取候选人名145
2.8.3 最长人名切分153
2.8.4 一元概率人名切分153
2.8.5 二元概率人名切分156
2.8.6 未登录地名159
2.8.7 未登录企业名160
2.9 平滑算法160
2.10 机器学习的方法164
2.10.1 最大熵165
2.10.2 条件随机场170
2.11 有限状态机171
2.12 地名切分178
2.12.1识别未登录地名179
2.12.2 整体流程185
2.13 企业名切分187
2.13.1 识别未登录词188
2.13.2 整体流程190
2.14 结果评测190
2.15 本章小结191
2.16 专业术语193
第3章 英文分析194
3.1 分词194
3.1.1 句子切分194
3.1.2 识别未登录串197
3.1.3 切分边界198
3.2 词性标注199
3.3 重点词汇202
3.4 句子时态203
3.5 本章小结204
第4章 依存文法分析205
4.1 句法分析树205
4.2 依存文法211
4.2.1中文依存文法211
4.2.2 英文依存文法220
4.2.3 生成依存树232
4.2.4 遍历235
4.2.5 机器学习的方法237
4.3 小结237
4.4 专业术语238
第5章 文档排重239
5.1 相似度计算239
5.1.1 夹角余弦239
5.1.2 最长公共子串242
5.1.3 同义词替换246
5.1.4 地名相似度248
5.1.5 企业名相似度251
5.2 文档排重251
5.2.1关键词排重251
5.2.2 SimHash254
5.2.3 分布式文档排重268
5.2.4 使用文本排重269
5.3 在搜索引擎中使用文本排重269
5.4 本章小结270
5.5 专业术语270
第6章 信息提取271
6.1 指代消解271
6.2 中文关键词提取273
6.2.1关键词提取的基本方法273
6.2.2 HITS算法应用于关键词提取275
6.2.3 从网页中提取关键词277
6.3 信息提取278
6.3.1 提取联系方式280
6.3.2 从互联网提取信息281
6.3.3 提取地名282
6.4 拼写纠错283
6.4.1 模糊匹配问题285
6.4.2 正确词表296
6.4.3 英文拼写检查298
6.4.4 中文拼写检查300
6.5 输入提示302
6.6 本章小结303
6.7 专业术语303
第7章 自动摘要304
7.1 自动摘要技术305
7.1.1 英文文本摘要307
7.1.2 中文文本摘要309
7.1.3 基于篇章结构的自动摘要314
7.1.4 句子压缩314
7.2 指代消解314
7.3 Lucene中的动态摘要314
7.4 本章小结317
7.5 专业术语318
第8章 文本分类319
8.1 地名分类321
8.2 错误类型分类321
8.3 特征提取322
8.4 关键词加权法326
8.5 朴素贝叶斯330
8.6 贝叶斯文本分类336
8.7 支持向量机336
8.7.1 多级分类345
8.7.2 规则方法347
8.7.3 网页分类350
8.8 最大熵351
8.9 信息审查352
8.10 文本聚类353
8.10.1 K均值聚类方法353
8.10.2 K均值实现355
8.10.3 深入理解DBScan算法359
8.10.4 使用DBScan算法聚类实例361
8.11 本章小结363
8.12 专业术语363
第9章 文本倾向性分析364
9.1 确定词语的褒贬倾向367
9.2 实现情感识别368
9.3 本章小结372
9.4 专业术语373
第10章 问答系统374
10.1 问答系统的结构375
10.1.1 提取问答对376
10.1.2 等价问题376
10.2 问句分析377
10.2.1问题类型377
10.2.2 句型381
10.2.3 业务类型381
10.2.4 依存树381
10.2.5 指代消解383
10.2.6 二元关系383
10.2.7 逻辑表示386
10.2.8 问句模板386
10.2.9 结构化问句模板389
10.2.10检索方式390
10.2.11问题重写395
10.2.12提取事实395
10.2.13验证答案398
10.2.14无答案的处理398
10.3 知识库398
10.4 聊天机器人399
10.4.1 交互式问答401
10.4.2 垂直领域问答系统402
10.4.3 语料库405
10.4.4 客户端405
10.5 自然语言生成405
10.6 依存句法406
10.7 提取同义词410
10.7.1 流程410
10.8 本章小结411
10.9 术语表412
第11章 语音识别413
11.1 总体结构414
11.1.1 识别中文416
11.1.2 自动问答417
11.2 语音库418
11.3 语音合成419
11.3.1 归一化420
11.4 语音420
11.4.1 标注424
11.4.2 相似度424
11.5 Sphinx424
11.5.1 中文训练集426
11.6 Julius429
11.7 本章小结429
11.8 术语表429
参考资源430
后记431
热门推荐
- 2122856.html
- 3011784.html
- 677866.html
- 1312886.html
- 53820.html
- 1631368.html
- 1739648.html
- 1670166.html
- 3342416.html
- 6908.html
- http://www.ickdjs.cc/book_3094820.html
- http://www.ickdjs.cc/book_1894642.html
- http://www.ickdjs.cc/book_50222.html
- http://www.ickdjs.cc/book_3765214.html
- http://www.ickdjs.cc/book_1624846.html
- http://www.ickdjs.cc/book_1572775.html
- http://www.ickdjs.cc/book_1083387.html
- http://www.ickdjs.cc/book_2458425.html
- http://www.ickdjs.cc/book_2425867.html
- http://www.ickdjs.cc/book_1406292.html