图书介绍
大数据架构和算法实现之路 电商系统的技术实战2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- 黄申著 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111569695
- 出版时间:2017
- 标注页数:425页
- 文件大小:42MB
- 文件页数:441页
- 主题词:数据处理
PDF下载
下载说明
大数据架构和算法实现之路 电商系统的技术实战PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
引子1
第一篇 支持高效的运营5
第1章 方案设计和技术选型:分类5
1.1分类的基本概念6
1.2分类任务的处理流程7
1.3算法:朴素贝叶斯和K最近邻8
1.3.1朴素贝叶斯8
1.3.2 K最近邻9
1.4分类效果评估10
1.5相关软件:R和Mahout12
1.5.1 R简介12
1.5.2 Mahout简介13
1.5.3 Hadoop简介14
1.6案例实践17
1.6.1实验环境设置17
1.6.2中文分词18
1.6.3使用R进行朴素贝叶斯分类22
1.6.4使用R进行K最近邻分类37
1.6.5单机环境使用Mahout运行朴素贝叶斯分类39
1.6.6多机环境使用Mahout运行朴素贝叶斯分类47
1.7更多的思考58
第2章 方案设计和技术选型:聚类60
2.1聚类的基本概念60
2.2算法:K均值和层次型聚类61
2.2.1 K均值聚类61
2.2.2层次型聚类62
2.3聚类的效果评估64
2.4案例实践66
2.4.1使用R进行K均值聚类66
2.4.2使用Mahout进行K均值聚类69
第3章 方案设计和技术选型:因变量连续的回归分析74
3.1线性回归的基本概念74
3.2案例实践76
3.2.1实验环境设置76
3.2.2 R中数据的标准化78
3.2.3使用R的线性回归分析81
第二篇 为顾客发现喜欢的商品:基础篇94
第4章 方案设计和技术选型:搜索94
4.1搜索引擎的基本概念94
4.1.1相关性95
4.1.2及时性97
4.2搜索引擎的评估100
4.3为什么不是数据库103
4.4系统框架104
4.4.1离线预处理104
4.4.2在线查询107
4.5常见的搜索引擎实现108
4.5.1 Lucene简介108
4.5.2 Solr简介113
4.5.3 Elasticsearch简介120
4.6案例实践123
4.6.1实验环境设置123
4.6.2基于Solr的实现123
4.6.3基于Elasticsearch的实现154
4.6.4统一的搜索API175
第三篇 为顾客发现喜欢的商品:高级篇195
第5章 方案设计和技术选型:NoSQL和搜索的整合195
5.1问题分析195
5.2 HBase简介196
5.3结合HBase和搜索引擎203
5.4案例实践204
5.4.1实验环境设置204
5.4.2 HBase的部署205
5.4.3 HBase和搜索引擎的集成211
第6章 方案设计和技术选型:查询分类和搜索的整合219
6.1问题分析219
6.2结合分类器和搜索引擎219
6.3案例实践225
6.3.1实验环境设置225
6.3.2构建查询分类器226
6.3.3定制化的搜索排序229
6.3.4整合查询分类和定制化排序236
第7章 方案设计和技术选型:个性化搜索245
7.1问题分析245
7.2结合用户画像和搜索引擎245
7.3案例实践249
7.3.1用户画像的读取250
7.3.2个性化搜索引擎253
7.3.3结果对比260
第8章 方案设计和技术选型:搜索分片267
8.1问题分析267
8.2利用搜索的分片机制269
8.3案例实践271
8.3.1 Solr路由的实现271
8.3.2 Elasticsearch路由的实现278
第9章 方案设计和技术选型:搜索提示283
9.1问题分析283
9.2案例实践:基础方案284
9.2.1 Solr搜索建议和拼写纠错的实现284
9.2.2 Elasticsearch搜索建议和拼写纠错的实现286
9.3改进方案291
9.4案例实践:改进方案294
第10章 方案设计和技术选型:推荐303
10.1推荐系统的基本概念305
10.2推荐的核心要素306
10.2.1系统角色306
10.2.2相似度307
10.2.3相似度传播框架307
10.3推荐系统的分类307
10.4混合模型311
10.5系统架构312
10.6 Mahout中的推荐算法313
10.7电商常见的推荐系统方案314
10.7.1电商常见的推荐系统方案314
10.7.2相似度的计算317
10.7.3协同过滤319
10.7.4结果的查询320
10.8案例实践321
10.8.1基于内容特征的推荐321
10.8.2基于行为特征的推荐341
第四篇 获取数据,跟踪效果369
第11章 方案设计和技术选型:行为跟踪369
11.1基本概念370
11.1.1网站的核心框架370
11.1.2行为数据的类型371
11.1.3行为数据的模式372
11.1.4设计理念374
11.2使用谷歌分析375
11.3自行设计之Flume、 HDFS和Hive的整合378
11.3.1数据的收集——Flume简介378
11.3.2数据的存储——H adoopHDFS回顾382
11.3.3批量数据分析——Hive简介383
11.3.4 Flume、 HDFS和Hive的整合方案386
11.4自行设计之Flume、 Kafka和Storm的整合386
11.4.1实时性数据分析之Kafka简介386
11.4.2实时性数据分析之Storm简介388
11.4.3 Flume、Kafka和Storm的整合方案390
11.5案例实践391
11.5.1数据模式的设计392
11.5.2实验环境设置392
11.5.3谷歌分析实战394
11.5.4自主设计实战之Flume、HDFS和Hive的整合401
11.5.5自主设计实战之Flume、Kafka和Storm的整合410
11.6更多的思考424
后记425
热门推荐
- 1297553.html
- 3033291.html
- 1807210.html
- 2966317.html
- 717343.html
- 2314476.html
- 2761524.html
- 2374453.html
- 2829700.html
- 1964568.html
- http://www.ickdjs.cc/book_727721.html
- http://www.ickdjs.cc/book_1027955.html
- http://www.ickdjs.cc/book_2540512.html
- http://www.ickdjs.cc/book_2021086.html
- http://www.ickdjs.cc/book_2250793.html
- http://www.ickdjs.cc/book_1407177.html
- http://www.ickdjs.cc/book_2024839.html
- http://www.ickdjs.cc/book_3419826.html
- http://www.ickdjs.cc/book_1151577.html
- http://www.ickdjs.cc/book_2990089.html