图书介绍
开源大数据分析引擎Impala实战2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- 贾传青著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302390022
- 出版时间:2015
- 标注页数:329页
- 文件大小:80MB
- 文件页数:349页
- 主题词:关系数据库系统
PDF下载
下载说明
开源大数据分析引擎Impala实战PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 Impala概述、安装与配置1
1.1 Impala概述1
1.2 Cloudera Manager安装准备2
1.3 CM及CDH安装10
1.4 Hive安装23
1.5 Impala安装26
第2章 Impala入门示例29
2.1 数据加载29
2.2 数据查询36
2.3 分区表37
2.4 外部分区表41
2.5 笛卡尔连接44
2.6 更新元数据45
第3章 Impala概念及架构47
3.1 Impala服务器组件47
3.1.1 Impala Daemon47
3.1.2 Impala Statestore48
3.1.3 Impala Catalog49
3.2 Impala应用编程51
3.2.1 Impala SQL方言52
3.2.2 Impala编程接口概述52
3.3 与Hadoop生态系统集成53
3.3.1 与Hive集成53
3.3.2 与HDFS集成53
3.3.3 使用HBase54
第4章 SQL语句55
4.1 注释55
4.2 数据类型56
4.2.1 BIGINT56
4.2.2 BOOLEAN57
4.2.3 DOUBLE58
4.2.4 FLOAT59
4.2.5 INT59
4.2.6 REAL60
4.2.7 SMALLINT60
4.2.8 STRING61
4.2.9 TIMESTAMP62
4.2.10 TINYINT66
4.3 常量66
4.3.1 数值常量66
4.3.2 字符串常量67
4.3.3 布尔常量67
4.3.4 时间戳常量68
4.3.5 NULL68
4.4 SQL操作符70
4.4.1 BETWEEN操作符70
4.4.2 比较操作符71
4.4.3 IN操作符72
4.4.4 IS NULL操作符72
4.4.5 LIKE操作符73
4.4.6 REGEXP操作符74
4.5 模式对象和对象名称75
4.5.1 别名75
4.5.2 标示符76
4.5.3 数据库76
4.5.4 表77
4.5.5 视图78
4.5.6 函数83
4.6 SQL语句83
4.6.1 ALTER TABLE84
4.6.2 ALTER VIEW90
4.6.3 COMPUTE STATS92
4.6.4 CREATE DATABASE95
4.6.5 CREATE FUNCTION96
4.6.6 CREATE TABLE98
4.6.7 CREATE VIEW103
4.6.8 DESCRIBE104
4.6.9 DROP DATABASE106
4.6.10 DROP FUNCTION107
4.6.11 DROP TABLE107
4.6.12 DROP VIEW108
4.6.13 EXPLAIN108
4.6.14 INSERT110
4.6.15 INVALIDATE METADATA116
4.6.16 LOAD DATA120
4.6.17 REFRESH124
4.6.18 SELECT125
4.6.19 SHOW143
4.6.20 USE147
4.7 内嵌函数148
4.7.1 数学函数150
4.7.2 类型转换函数155
4.7.3 时间和日期函数155
4.7.4 条件函数160
4.7.5 字符串函数161
4.7.6 特殊函数166
4.8 聚集函数167
4.8.1 AVG167
4.8.2 COUNT168
4.8.3 GROUP_CONCAT169
4.8.4 MAX169
4.8.5 MIN170
4.8.6 NDV170
4.8.7 SUM171
4.9 用户自定义函数UDF171
4.9.1 UDF概念172
4.9.2 安装UDF开发包176
4.9.3 编写UDF176
4.9.4 编写UDAF179
4.9.5 编译和部署UDF183
4.9.6 UDF性能184
4.9.7 创建和使用UDF示例184
4.9.8 UDF安全193
4.9.9 Impala UDF的限制193
4.10 Impala SQL&Hive QL193
4.11 将SQL移植到Impala上195
第5章 Impala shell201
5.1 命令行选项201
5.2 连接到Impalad209
5.3 运行命令210
5.4 命令参考210
5.5 查询参数设置211
第6章 Impala管理228
6.1 准入控制和查询队列228
6.1.1 准入控制概述228
6.1.2 准入控制和YARN229
6.1.3 并发查询限制229
6.1.4 准入控制和Impala客户端协同工作230
6.1.5 配置准入控制230
6.1.6 使用准入控制指导原则236
6.2 使用YARN资源管理(CDH5)237
6.2.1 Llama进程237
6.2.2 检查计算的资源和实际使用的资源237
6.2.3 资源限制如何生效238
6.2.4 启用Impala资源管理238
6.2.5 资源管理相关impala-shell参数238
6.2.6 Impala资源管理的限制238
6.3 为进程,查询,会话设定超时限制239
6.4 通过代理实现Impala高可用性240
6.5 管理磁盘空间243
第7章 Impala存储245
7.1 文件格式选择245
7.2 Text247
7.2.1 查询性能247
7.2.2 创建文本表248
7.2.3 数据文件249
7.2.4 加载数据249
7.2.5 LZO压缩250
7.3 Parquet253
7.3.1 创建Parquet表253
7.3.2 加载数据254
7.3.3 查询性能255
7.3.4 Snappy/Gzip压缩256
7.3.5 与其他组件交换Parquet数据文件260
7.3.6 Parquet数据文件组织方式260
7.4 Avro263
7.4.1 创建Avro表263
7.4.2 使用Hive创建的Avro表265
7.4.3 通过JSON指定Avro模式265
7.4.4 启用压缩265
7.4.5 模式进化266
7.5 RCFile268
7.5.1 创建RCFile表和加载数据268
7.5.2 启用压缩269
7.6 SequenceFile270
7.6.1 创建和加载数据270
7.6.2 启用压缩271
7.7 HBase272
7.7.1 支持的Hbase列类型273
7.7.2 性能问题273
7.7.3 适用场景280
7.7.4 数据加载281
7.7.5 启用压缩281
7.7.6 限制282
7.7.7 示例282
第8章 Impala分区284
8.1 分区技术适用场合284
8.2 分区表相关SQL语句285
8.3 分区修剪285
8.4 分区键列288
8.5 使用不同的文件格式288
第9章 Impala性能优化290
9.1 最佳实践290
9.2 连接查询优化291
9.3 使用统计信息301
9.4 基准测试309
9.5 控制资源使用309
9.6 性能测试310
9.7 使用EXPLAIN信息311
9.8 使用PROFILE信息312
第10章 Impala设计原则与应用案例322
10.1 设计原则322
10.2 应用案例323
热门推荐
- 1853284.html
- 2343054.html
- 1857035.html
- 2362766.html
- 233545.html
- 368779.html
- 1221163.html
- 1223948.html
- 1394619.html
- 343890.html
- http://www.ickdjs.cc/book_2597407.html
- http://www.ickdjs.cc/book_245249.html
- http://www.ickdjs.cc/book_2557467.html
- http://www.ickdjs.cc/book_3035609.html
- http://www.ickdjs.cc/book_3608088.html
- http://www.ickdjs.cc/book_3434954.html
- http://www.ickdjs.cc/book_2559764.html
- http://www.ickdjs.cc/book_1098954.html
- http://www.ickdjs.cc/book_1181279.html
- http://www.ickdjs.cc/book_3516371.html