图书介绍

数据仓库与数据分析教程2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

数据仓库与数据分析教程
  • 王珊,李翠平,李盛恩等编著 著
  • 出版社: 北京:高等教育出版社
  • ISBN:9787040341300
  • 出版时间:2012
  • 标注页数:222页
  • 文件大小:67MB
  • 文件页数:232页
  • 主题词:数据库系统-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据仓库与数据分析教程PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一篇 数据仓库技术2

第一章 从数据库到数据仓库2

1.1 数据仓库产生的原因2

1.1.1 操作型数据处理2

1.1.2 分析型数据处理3

1.1.3 两种数据处理模式的差别4

1.1.4 数据库系统的局限性5

1.2 数据仓库的基本概念6

1.2.1 主题与面向主题7

1.2.2 数据仓库的其他三个特征11

1.2.3 数据仓库的功能13

1.3 数据仓库的体系结构14

1.3.1 体系结构14

1.3.2 数据集市16

小结20

习题20

第二章 操作数据存储21

2.1 什么是ODS22

2.1.1 ODS的定义及特点22

2.1.2 ODS的功能和实现机制22

2.2 DB~ODS~DW体系结构26

2.2.1 ODS与DW26

2.2.2 DB~ODS~DW三层体系结构27

小结29

习题29

第三章 数据仓库中的数据及组织30

3.1 数据仓库中的数据组织30

3.2 数据仓库中数据的追加32

3.3 数据仓库中的元数据33

3.3.1 元数据的定义33

3.3.2 元数据的分类34

3.3.3 元数据管理的标准化36

小结39

习题39

第二篇 联机分析处理技术42

第四章 概述及模型42

4.1 OLAP技术概述42

4.1.1 OLAP的起源42

4.1.2 OLAP的定义42

4.1.3 OLAP与OLTP的区别43

4.1.4 OLAP核心技术43

4.2 多维数据模型44

4.2.1 基本概念44

4.2.2 星形、雪片和事实群模型49

4.3 多维分析操作51

4.3.1 多维分析基础:聚集52

4.3.2 常用多维分析操作53

4.3.3 其他多维分析操作55

4.3.4 聚集的一些限制57

4.3.5 水平层次结构和非水平层次结构59

4.4 多维查询语言60

4.4.1 MDX简介61

4.4.2 MDX对象模型62

4.5 多维数据展示63

4.5.1 三维数据展示63

4.5.2 高维数据展示64

小结65

习题65

第五章 数据方体的存储、预计算和缩减66

5.1 数据方体的存储66

5.1.1 MOLAP66

5.1.2 ROLAP70

5.1.3 MOLAP和ROLAP实现机制的比较73

5.2 数据方体的预计算75

5.2.1 预计算的相关概念75

5.2.2 数据方体格结构76

5.2.3 数据方体格存储方法77

5.3 完整数据方体的预计算方法78

5.3.1 流水线算法78

5.3.2 BUC算法80

5.4 部分数据方体的预计算方法83

5.4.1 BPUS算法84

5.4.2 PBS算法87

5.5 数据方体的缩减技术88

5.5.1 Drawf数据方体88

5.5.2 Condensed数据方体90

5.5.3 Quotient数据方体91

小结93

习题93

第六章 数据方体的索引、查询和维护94

6.1 数据方体的索引技术94

6.1.1 树索引94

6.1.2 位图索引99

6.2 数据方体的查询处理和优化技术101

6.2.1 子查询划分技术102

6.2.2 子查询处理及优化技术105

6.3 数据方体的维护技术106

小结107

习题107

第三篇 数据挖掘技术110

第七章 数据挖掘概述110

7.1 数据挖掘简介110

7.1.1 数据挖掘的特点110

7.1.2 数据挖掘与KDD111

7.1.3 数据挖掘与OLAP112

7.1.4 数据挖掘与数据仓库113

7.1.5 数据挖掘的分类113

7.1.6 数据挖掘的应用114

7.2 数据挖掘算法的组件化思想116

7.2.1 模型或模式结构116

7.2.2 数据挖掘的任务117

7.2.3 评分函数118

7.2.4 搜索和优化方法118

7.2.5 数据管理策略119

7.2.6 组件化思想的应用119

小结120

习题120

第八章 频繁模式挖掘121

8.1 频繁项集和关联规则121

8.1.1 问题描述122

8.1.2 关联规则分类124

8.1.3 关联规则挖掘的经典算法Apriori125

8.1.4 关联规则挖掘的重要算法FP-Growth133

8.1.5 其他关联规则挖掘方法135

8.1.6 关联规则的兴趣度137

8.2 序列模式挖掘138

8.2.1 问题描述138

8.2.2 GSP算法140

8.2.3 PrefixSpan算法143

8.3 频繁子图挖掘145

8.3.1 问题描述145

8.3.2 基于Apriori的宽度优先算法146

8.3.3 基于FP-Growth的深度优先搜索算法147

小结148

习题149

第九章 预测建模:分类和回归150

9.1 预测建模简介150

9.1.1 用于预测的模型结构151

9.1.2 用于预测的评分函数154

9.1.3 用于预测的搜索和优化策略154

9.2 决策树分类155

9.2.1 建树阶段156

9.2.2 剪枝阶段162

9.2.3 分类规则的生成162

9.2.4 可扩展性问题163

9.2.5 其他问题163

9.3 贝叶斯分类164

9.3.1 基本概念164

9.3.2 朴素贝叶斯分类166

9.4 支持向量机分类167

9.4.1 线性可分时的二元分类问题168

9.4.2 线性不可分时的二元分类问题171

9.4.3 多元分类问题172

9.4.4 可扩展性问题173

9.5 人工神经网络分类173

9.5.1 神经网络的组成173

9.5.2 神经网络的分类方法175

小结178

习题178

第十章 描述建模:聚类180

10.1 聚类分析简介180

10.1.1 对象间的相似性180

10.1.2 其他相似性度量183

10.2 聚类方法概述184

10.2.1 基于划分的聚类方法185

10.2.2 基于密度的聚类方法190

10.2.3 基于层次的聚类方法194

10.2.4 基于模型的聚类方法201

10.2.5 基于方格的聚类方法203

小结204

习题205

附录 产品与工具206

附录A IBM数据仓库解决方案206

附录B Oracle数据仓库解决方案209

附录C Microsoft SQLServer 2005数据仓库解决方案210

附录D Sybase数据仓库解决方案211

附录E Group 1 Sagent介绍211

附录F Informatica介绍212

参考文献214

热门推荐