图书介绍

管理海量数据-压缩、索引和查询第2版2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

（美）IanH·Witten（美）AlistairMoffat（美）TimothyC·Bell著；梁斌杨青译著
出版社：北京：电子工业出版社
ISBN：7121219337
出版时间：2014
标注页数：514页
文件大小：231MB
文件页数：541页
主题词：

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：1f1e3694764b109465ed25a07eb67dce

下载说明

管理海量数据-压缩、索引和查询第2版PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第1章概览1

1.1文档数据库（document databases）7

1.2压缩（compression）10

1.3索引（indexes）12

1.4文档索引16

1.5 MG海量文档管理系统20

第2章文本压缩23

2.1模型26

2.2自适应模型29

2.3哈夫曼编码32

范式哈夫曼编码38

计算哈夫曼编码长度44

总结52

2.4算术编码52

算术编码是如何工作的53

实现算术编码57

保存累积计数60

2.5符号模型61

部分匹配预测62

块排序压缩65

动态马尔科夫压缩69

基于单字的压缩72

2.6字典模型73

自适应字典编码器的LZ77系列75

LZ77的Gzip变体78

自适应字典编码器的LZ78系列80

LZ78的LZW变体82

2.7同步84

创造同步点85

自同步编码87

2.8性能比较90

压缩性能92

压缩速度95

其他性能方面的考虑98

第3章索引99

3.1样本文档集合103

3.2倒排文件索引107

3.3压缩倒排文件112

无参模型（Nonparameterized models）114

全局贝努里模型117

全局观测频率模型（Global observed frequency model）120

局部贝努里模型（Local Bernoulli model）121

有偏贝努里模型（Skewed Bernoulli model）122

局部双曲模型（Local hyperbolic model）124

局部观测频率模型（Local observed frequency model）125

上下文相关压缩（Context-sensitive compression）127

3.4索引压缩方法的效果129

3.5签名文件和位图131

签名文件132

位片签名文件（Bitsliced signature files）136

签名文件分析141

位图144

签名文件和位图的压缩145

3.6索引方法的比较148

3.7大小写折叠、词根化和停用词150

大小写折叠151

词根化151

影响索引长度的因素152

停用词（stop word）153

第4章查询157

4.1访问字典的方法161

访问数据结构162

前端编码（Front coding）165

最小完美哈希函数168

完美哈希函数的设计171

基于磁盘的字典存储176

4.2部分指定的查询术语177

字符串暴力匹配（Brute-force string matching）177

用n-gram索引178

循环字典（Rotated lexicon）180

4.3布尔查询（BooLEAN QUERY）182

合取查询（conjunctive query）182

术语处理顺序183

随机访问和快速查找185

分块倒排索引187

非合取查询（Nonconjunctive Query）190

4.4信息检索和排名191

坐标匹配（Coordinate matching）191

内积相似度192

向量空间模型197

4.5检索效果评价200

召回率和精确率200

召回率——精确率曲线203

TREC项目204

万维网搜索（World Wide Web Searching）208

其他有效性评价方法211

4.6余弦法实现212

文档内频率212

余弦值的计算方法216

文档权重所需的内存217

累加器内存222

快速查询处理224

按频率排序的索引225

排序228

4.7交互式检索232

图书介绍

管理海量数据-压缩、索引和查询 第2版2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

PDF下载

下载说明

管理海量数据-压缩、索引和查询 第2版PDF格式电子书版下载

图书目录

热门推荐

管理海量数据-压缩、索引和查询第2版2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

管理海量数据-压缩、索引和查询第2版PDF格式电子书版下载