图书介绍

Elasticsearch大数据搜索引擎2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

Elasticsearch大数据搜索引擎
  • 罗刚编著 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121332333
  • 出版时间:2018
  • 标注页数:217页
  • 文件大小:63MB
  • 文件页数:229页
  • 主题词:搜索引擎-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Elasticsearch大数据搜索引擎PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 使用Elasticsearch1

1.1基本概念1

1.2安装2

1.3搜索集群5

1.4创建索引6

1.5使用Java客户端接口9

1.5.1创建索引11

1.5.2增加、删除与修改数据14

1.5.3分析器16

1.5.4数据导入17

1.5.5通过摄取快速导入数据17

1.5.6索引库结构17

1.5.7查询18

1.5.8区间查询22

1.5.9排序23

1.5.10分布式搜索23

1.5.11过滤器24

1.5.12高亮显示24

1.5.13分页25

1.5.14通过聚合实现分组查询26

1.5.15 文本列的聚合27

1.5.16遍历数据28

1.5.17索引文档29

1.5.18 Percolate29

1.6 RESTClient30

1.6.1使用摄取31

1.6.2代码实现摄取33

1.7使用Jest33

1.8 Python客户端37

1.9 Scala客户端40

1.10 PHP客户端43

1.11 SQL支持44

1.12本章小结48

第2章 开发插件49

2.1搜索中文49

2.1.1中文分词原理49

2.1.2中文分词插件原理51

2.1.3开发中文分词插件53

2.1.4中文AnalyzerProvider55

2.1.5字词混合索引57

2.2搜索英文60

2.2.1句子切分60

2.2.2标注词性62

2.3使用测试套件64

2.4本章小结68

第3章 管理搜索集群69

3.1节点类型69

3.2管理集群69

3.3写入权限控制70

3.4使用X-Pack71

3.5快照72

3.6 Zen发现机制73

3.7联合搜索74

3.8缓存74

3.9本章小结75

第4章 源码分析76

4.1 Lucene源码分析76

4.1.1 Ivy管理依赖项76

4.1.2源码结构介绍76

4.2 Gradle77

4.3 Guice77

4.4 Joda-Time79

4.5 Transport80

4.6线程池80

4.7模块80

4.8 Netty81

4.9分布式81

4.10本章小结82

第5章 搜索相关性83

5.1 BM25检索模型83

5.1.1使用BM25检索模型86

5.1.2参数调优86

5.2学习评分86

5.2.1基本原理87

5.2.2准备数据87

5.2.3 Elasticsearch学习排名89

5.3本章小结91

第6章 搜索引擎用户界面92

6.1 JSP实现搜索界面92

6.1.1用于显示搜索结果的自定义标签93

6.1.2使用Listlib98

6.1.3实现翻页100

6.2使用Spring实现的搜索界面102

6.2.1实现REST搜索界面102

6.2.2 REST API中的HTTP PUT104

6.2.3 Spring-data-elastic search106

6.2.4 Spring HATEOAS112

6.3实现搜索接口113

6.3.1编码识别113

6.3.2布尔搜索116

6.3.3搜索结果排序116

6.4实现相似文档搜索117

6.5实现AJAX搜索联想词119

6.5.1估计查询词的文档频率119

6.5.2搜索联想词总体结构119

6.5.3服务器端处理120

6.5.4浏览器端处理125

6.5.5拼音提示127

6.5.6部署总结127

6.5.7 Suggester128

6.6推荐搜索词129

6.6.1挖掘相关搜索词130

6.6.2使用多线程计算相关搜索词132

6.7查询意图理解133

6.7.1拼音搜索133

6.7.2无结果处理133

6.8集成其他功能134

6.8.1拼写检查134

6.8.2分类统计135

6.8.3相关搜索141

6.8.4再次查找144

6.8.5搜索日志144

6.9查询分析146

6.9.1历史搜索词记录146

6.9.2日志信息过滤147

6.9.3信息统计148

6.9.4挖掘日志信息150

6.9.5查询词意图分析150

6.10部署网站150

6.10.1部署到Web服务器151

6.10.2防止攻击152

6.11本章小结156

第7章OCR文字识别157

7.1 Tesseract157

7.2使用TensorFlow识别文字161

7.3 OpenCV164

7.3.1预处理166

7.3.2文字区域提取169

7.3.3纠正偏斜171

7.3.4 Linux环境支持172

7.4 JavaCV172

7.5本章小结174

第8章 问答式搜索176

8.1生成表示语义的代码176

8.2信息整合181

8.2.1实体对齐181

8.2.2编辑距离181

8.2.3 Jaro-Winkler距离187

8.2.4比较器189

8.2.5 Cleaner189

8.2.6运行过程190

8.2.7遗传算法调整参数192

8.3自动问答193

8.3.1问句处理器193

8.3.2自动发现答案198

8.4本章小结199

第9章Elastic系统监控201

9.1 Logstash201

9.1.1使用Logstash201

9.1.2插件203

9.1.3数据库输入插件206

9.2 Filebeat207

9.3消息过期208

9.4 Kibana208

9.5 Flume209

9.6 Kafka210

9.7 Graylog211

9.8物联网数据215

9.9本章小结216

热门推荐