图书介绍

数据仓库与数据挖掘2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

数据仓库与数据挖掘
  • 武森等著 著
  • 出版社: 北京:冶金工业出版社
  • ISBN:7502432949
  • 出版时间:2003
  • 标注页数:379页
  • 文件大小:25MB
  • 文件页数:394页
  • 主题词:数据库系统

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据仓库与数据挖掘PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

目录1

1 数据仓库概述1

1.1 数据仓库的产生1

1.2 数据仓库的含义3

1.3 数据仓库的特征5

1.4 操作型数据库系统与数据仓库7

1.5 数据仓库的基本结构9

本章要点11

2 数据仓库相关概念12

2.1 主题12

2.2 粒度13

2.3 维度15

2.4 数据立方体17

2.5 联机分析处理20

2.6 数据集市23

本章要点25

3 多维数据模型27

3.1 实体-关系模型与多维模型27

3.1.1 实体-关系模型27

3.1.2 多维数据模型28

3.1.3 多维数据模型的优势30

3.2 星形模式32

3.2.1 星形模式的含义32

3.2.2 主码、外码和代理码34

3.2.3 事实表36

3.2.4 维表38

3.3 星形模式的种类39

3.3.1 简单星形模式39

3.3.2 星系模式39

3.3.3 星座模式41

3.3.4 二级维表42

3.3.5 雪花模式42

3.4 数据仓库的总线型结构44

3.4.1 总线型结构的含义44

3.4.2 统一的维45

3.4.3 统一的事实46

3.4.4 数据仓库的总线47

本章要点49

4 数据仓库的体系结构51

4.1 体系结构的内容51

4.1.1 总体框架51

4.1.2 技术体系结构52

4.2 相关的数据存储54

4.2.1 数据源55

4.2.2 主题数据56

4.2.3 预处理数据58

4.2.4 查询服务数据60

4.3 相关的数据服务61

4.3.1 后台数据预处理61

4.3.2 前台数据查询服务62

4.4 相关的数据管理——元数据64

4.4.1 元数据的含义64

4.4.2 元数据的内容65

4.4.3 元数据的工作流程67

本章要点69

5 数据仓库的数据组织71

5.1 事实表和维表的设计71

5.1.1 事实数据和维数据的区分71

5.1.2 事实表的设计72

5.1.4 常见维设计举例75

5.1.3 维表的设计75

5.2 数据聚集的设计79

5.2.1 数据聚集的含义79

5.2.2 数据聚集的创建方法80

5.3 数据仓库中的索引82

5.3.1 传统的数据库索引技术82

5.3.2 事实表的索引84

5.3.3 维表的索引85

5.3.4 数据仓库索引举例86

5.3.5 数据仓库索引新技术88

5.4 数据库的物理设计91

5.4.1 物理设计的内容91

5.4.2 数据库对象的命名规范92

5.4.3 物理模型的建立93

5.4.4 数据仓库的数据量估计95

本章要点96

6 数据仓库的数据预处理98

6.1 数据的净化98

6.1.1 数据质量与数据净化98

6.1.2 数据净化的方法100

6.1.3 其他提高数据质量的方法102

6.2 数据预处理计划104

6.2.1 初步计划104

6.2.2 详细计划106

6.3 维表的数据预处理108

6.3.1 维表的基本数据预处理108

6 3.2 代理码的分配110

6.3.3 维表的变更处理111

6.4 事实表的数据预处理113

6.4.1 事实表的基本数据预处理113

6.4.2 非代理码的替换115

6.4.3 数据聚集的更新维护116

本章要点117

7 联机分析处理——OLAP119

7.1 基于多维模型的数据分析119

7.1.1 OLAP的含义与特征119

7.1.2 OLAP的基本操作120

7.2 数据仓库建设与OLAP应用例123

7.2.1 订货分析主题123

7.2.2 数据源分析124

7.2.3 订货分析的星形模式125

7.2.4 订货分析的DTS包130

7.2.5 订货分析的OLAP实践135

本章要点138

8 数据仓库的规划与管理139

8.1 数据仓库系统的生命周期139

8.2 项目的准备141

8.3 项目团队的组织142

8.4 项目的进度安排144

8.5 项目的文档管理145

本章要点146

9 数据挖掘概述148

9.1 KDD与数据挖掘148

9.2 KDD过程150

9.3 数据挖掘的任务152

9.4 数据仓库与数据挖掘153

本章要点155

10 数据挖掘的数据准备157

10.1 数据准备概述157

10.1.1 数据准备的内容157

10.1.2 与数据仓库的比较159

10.2.1 异常值处理161

10.2 数据的应用变换161

10.2.2 数据标准化164

10.2.3 数据泛化166

10.2.4 数据聚集169

10.3 数据的精简170

10.3.1 属性子集选择170

10.3.2 主成分分析171

10.3.3 离散小波转换172

10.3.4 回归方法174

10.3.5 数据抽样175

本章要点177

11 聚类分析179

11.1 聚类分析概述179

11.1.1 聚类分析的含义179

11.1.2 聚类方法的分类180

11.1.3 数据挖掘应用对聚类分析的要求181

11.2 差异度的计算方法183

11.2.1 区间变量183

11.2.2 二态变量184

11.2.3 分类变量186

11.2.4 序数变量187

11.2.5 计算中的其他问题188

11.3 分割聚类方法190

11.3.1 分割聚类方法概述190

11.3.2 k means算法191

11.3.3 PAM算法194

11.3.4 CLARA算法196

11.3.5 CLARANS算法197

11.4 层次聚类方法200

11.4.1 层次聚类方法概述200

11.4.2 层次聚类基本算法202

11.4.3 BIRCH算法204

11.4.4 CURE算法208

11.5 基于密度的聚类方法211

11.5.1 基于密度的聚类方法概述211

11.5.2 DBSCAN算法213

11.5.3 OPTICS算法215

11.5.4 基于密度和网格的CLIQUE算法218

11.6 高维稀疏聚类CABOSFV算法221

11.6.1 算法的主要思想221

11.6.2 算法的概念基础223

11.6.3 算法的聚类过程225

11.6.4 算法举例227

本章要点231

12.1.1 分类发现的含义与过程233

12.1 分类发现概述233

12 分类发现233

12.1.2 分类模型的评估标准234

12.1.3 分类发现的主要方法236

12.2 决策树算法237

12.2.1 决策树算法概述237

12.2.2 决策树的生成238

12.2.3 决策树生成举例240

12.2.4 决策树剪枝举例243

12.2.5 从决策树中提取规则244

12.3 ID3算法245

12.3.1 ID3算法的决策属性选择方法245

12.3.2 ID3算法示例246

12.3.3 树的剪枝249

12.3.4 ID3的几种改进方法250

12.4 ID3改进算法CAMM251

12.4.1 CAMM算法的概念基础252

12.4.2 CAMM算法的处理过程254

12.4.3 CAMM算法决策树生成举例255

12.4.4 CAMM算法的规则提取259

12.4.5 决策树算法与数据仓库技术的集成261

12.5 贝叶斯分类264

12.5.1 贝叶斯原理265

12.5.2 简单贝叶斯分类266

12.5.3 贝叶斯信念网络269

12.6 基于神经网络BP算法的分类271

12.6.1 多层前馈神经网络271

12.6.2 BP算法273

12.6.3 BP算法的解释275

12.6.4 其他分类算法276

本章要点278

13.1.1 关联规则的基本概念281

13 关联规则发现281

13.1 关联规则概述281

13.1.2 描述关联规则的参数282

13.1.3 关联规则分类285

13.1.4 发现关联规则的过程286

13.2 Apriori算法286

13.2.1 Apriori算法概述287

13.2.2 Apriori性质与算法步骤288

13.2.3 Apriori算法举例290

13.2.4 由频繁集产生关联规则293

13.2.5 Apriori算法的几种优化方法294

13.3 FP-growth方法297

13.3.1 FP-growth方法的概念与步骤297

13.3.2 FP-tree的建立298

13.3.3 在FP-tree上挖掘关联规则299

13.4 多层与多维关联规则302

13.4.1 概念树302

13.4.2 自上而下挖掘多层关联规则303

13.4.3 自下而上挖掘多层关联规则307

13.4.4 多维关联规则310

13.4.5 数值属性的离散化311

13.5 具有利润约束的关联规则314

13.5.1 利润约束315

13.5.2 具有利润约束的频繁集316

13.5.3 具有利润约束的关联规则发现算法318

13.5.4 算法示例320

13.5.5 其他约束条件322

本章要点325

14.1.1 分布式数据挖掘简介327

14.1 分布式数据挖掘327

14 数据挖掘的发展与应用327

14.1.2 分布式数据挖掘系统329

14.1.3 研究现状331

14.2 分布式数据挖掘算法332

14.2.1 分布式关联规则333

14.2.2 分布式分类算法337

14.3 数据挖掘软件发展340

14.3.1 系统功能的发展341

14.3.2 应用模式的发展342

14.4 数据挖掘标准344

14.4.1 过程标准344

14.4.2 实现标准351

本章要点358

名词索引360

参考文献372

热门推荐