图书介绍

数据仓库与数据挖掘实践2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

数据仓库与数据挖掘实践
  • 李春葆,李石君,李筱驰编著 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121244926
  • 出版时间:2014
  • 标注页数:355页
  • 文件大小:72MB
  • 文件页数:368页
  • 主题词:数据库系统;数据采集

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据仓库与数据挖掘实践PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 数据仓库概述1

1.1 数据仓库及其历史1

1.1.1 数据库技术的发展1

1.1.2 什么是数据仓库2

1.2 数据仓库系统及其开发工具5

1.2.1 数据仓库系统的组成5

1.2.2 ETL6

1.2.3 数据仓库和数据集市的关系6

1.2.4 元数据及其管理7

1.3 数据仓库系统开发工具8

1.4 数据仓库与操作型数据库的关系9

1.4.1 从数据库到数据仓库9

1.4.2 数据仓库为什么是分离的10

1.4.3 数据仓库与操作型数据库的对比10

1.4.4 ODS11

1.5 商务智能与数据仓库的关系11

练习题112

思考题113

第2章 数据仓库设计14

2.1 数据仓库设计概述14

2.1.1 数据仓库设计原则14

2.1.2 数据仓库构建模式14

2.1.3 数据仓库设计步骤15

2.2 数据仓库的规划和需求分析15

2.2.1 数据仓库的规划15

2.2.2 数据仓库的需求分析16

2.3 数据仓库的建模17

2.3.1 多维数据模型及相关概念17

2.3.2 多维数据模型的实现18

2.3.3 数据仓库建模的主要工作19

2.3.4 几种常见的基于关系数据库的多维数据模型21

2.4 数据仓库的物理模型设计26

2.4.1 确定数据的存储结构27

2.4.2 确定索引策略27

2.4.3 确定存储分配27

2.5 数据仓库的部署和维护28

2.5.1 数据仓库的部署28

2.5.2 数据仓库的维护28

2.6 一个简单的数据仓库SDWS设计示例29

2.6.1 SDWS的需求分析29

2.6.2 SDWS的建模29

2.6.3 基于SQL Server 2008设计SDWS35

练习题242

思考题243

第3章 OLAP技术44

3.1 OLAP概述44

3.1.1 什么是OLAP44

3.1.2 OLAP技术的特性44

3.1.3 OLAP和OLTP的区别45

3.1.4 数据仓库与OLAP的关系46

3.1.5 OLAP分类46

3.2 OLAP的多维数据模型48

3.2.1 多维数据模型的定义48

3.2.2 OLAP的基本分析操作49

3.2.3 一个简单的多维数据模型53

3.3 OLAP实现56

3.3.1 数据立方体的有效计算56

3.3.2 索引OLAP数据61

3.3.3 OLAP查询的有效处理62

练习题363

思考题364

第4章 数据挖掘概述65

4.1 什么是数据挖掘65

4.1.1 数据挖掘的定义65

4.1.2 数据挖掘的知识表示66

4.1.3 数据挖掘的主要任务66

4.1.4 数据挖掘的发展67

4.1.5 数据挖掘的对象67

4.1.6 数据挖掘的分类68

4.1.7 数据挖掘与数据仓库及OLAI的关系68

4.1.8 数据挖掘的应用69

4.2 数据挖掘系统70

4.2.1 数据挖掘系统的结构70

4.2.2 数据挖掘系统的设计71

4.2.3 常用的数据挖掘系统及其发展73

4.3 数据挖掘过程74

4.3.1 数据挖掘步骤74

4.3.2 数据清理74

4.3.3 数据集成75

4.3.4 数据变换76

4.3.5 数据归约77

4.3.6 离散化和概念分层生成79

4.3.7 数据挖掘的算法81

4.4 数据挖掘的未来展望83

练习题483

思考题484

第5章 关联分析85

5.1 关联分析的概念85

5.1.1 事务数据库85

5.1.2 关联规则及其度量86

5.1.3 频繁项集87

5.1.4 挖掘关联规则的基本过程87

5.2 Apriori算法88

5.2.1 Apriori性质88

5.2.2 Apriori算法89

5.2.3 由频繁项集产生关联规则93

5.2.4 提高Apriori算法的有效性96

5.2.5 非二元属性的关联规则挖掘99

5.3 频繁项集的紧凑表示100

5.3.1 最大频繁项集100

5.3.2 频繁闭项集101

5.4 FP-growth算法103

5.4.1 FP-growth算法框架103

5.4.2 FP树构造104

5.4.3 由FP树产生频繁项集107

5.5 多层关联规则的挖掘109

5.5.1 多层关联规则的挖掘概述109

5.5.2 多层关联规则的挖掘算法111

5.5.3 多维关联规则114

5.6 其他类型的关联规则114

5.6.1 基于约束的关联规则114

5.6.2 负关联规则114

5.7 SQL Server挖掘关联规则的示例115

5.7.1 建立DM数据库115

5.7.2 建立关联挖掘项目116

5.7.3 部署关联挖掘项目并浏览结果120

练习题5122

思考题5126

第6章 序列模式挖掘127

6.1 序列模式挖掘概述127

6.1.1 序列数据库127

6.1.2 序列模式挖掘算法129

6.2 Apriori类算法130

6.2.1 AprioriAll算法130

6.2.2 AprioriSome算法135

6.2.3 DynamicSome算法138

6.2.4 GSP算法140

6.2.5 SPADE算法144

6.3 模式增长框架的序列挖掘算法150

6.3.1 FreeSpan算法150

6.3.2 PrefixSpan算法152

练习题6155

思考题6157

第7章 分类方法158

7.1 分类过程158

7.1.1 学习阶段158

7.1.2 分类阶段160

7.2 k-最邻近分类算法160

7.3 决策树分类算法162

7.3.1 决策树162

7.3.2 建立决策树的ID3算法163

7.3.3 建立决策树的C4.5 算法173

7.4 贝叶斯分类算法175

7.4.1 贝叶斯分类概述175

7.4.2 朴素贝叶斯分类177

7.4.3 树增强朴素贝叶斯分类183

7.5 神经网络算法185

7.5.1 生物神经元和人工神经元185

7.5.2 人工神经网络187

7.5.3 前馈神经网络用于分类189

7.5.4 SQL Server中神经网络分类示例196

7.6 支持向量机199

7.6.1 线性可分时的二元分类问题199

7.6.2 线性不可分时的二元分类问题203

练习题7206

思考题7209

第8章 回归分析和时序挖掘210

8.1 线性和非线性回归分析210

8.1.1 一元线性回归分析210

8.1.2 多元线性回归分析213

8.1.3 非线性回归分析214

8.2 逻辑回归分析217

8.2.1 逻辑回归原理217

8.2.2 逻辑回归模型218

8.2.3 SQL Server中逻辑回归分析示例219

8.3 时序分析模型221

8.3.1 时序分析概述221

8.3.2 时序预测的常用方法222

8.3.3 回归分析与时序分析的关系223

8.3.4 确定性时序模型223

8.3.5 随机时序模型226

8.3.6 SQL Server建立随机时序模型示例228

8.4 时序的相似性搜索231

8.4.1 相似性搜索的概念231

8.4.2 完全匹配232

8.4.3 基于离散傅里叶变换的子序列匹配232

8.4.4 基于规范变换的子序列匹配234

练习题8236

思考题8237

第9章 粗糙集理论238

9.1 粗糙集理论概述238

9.1.1 粗糙集理论的产生238

9.1.2 粗糙集理论的特点238

9.1.3 粗糙集理论在数据挖掘中的应用239

9.2 粗糙集理论中的基本概念239

9.2.1 集合的基本概念239

9.2.2 信息系统和粗糙集240

9.2.3 分类的近似度量244

9.3 信息系统的属性约简245

9.3.1 约简和核245

9.3.2 分辨矩阵求核246

9.4 决策表及其属性约简247

9.4.1 决策表及相关概念247

9.4.2 决策表的属性约简算法251

9.5 决策表的值约简及其算法258

9.5.1 决策规则及其简化258

9.5.2 决策规则的极小化261

9.6 粗糙集在数据挖掘中的应用示例265

练习题9266

思考题9269

第10章 聚类方法270

10.1 聚类概述270

10.1.1 什么是聚类270

10.1.2 相似性测度270

10.1.3 聚类过程272

10.1.4 聚类算法的评价272

10.1.5 聚类方法的分类274

10.1.6 聚类分析在数据挖掘中的应用275

10.1.7 聚类算法的要求275

10.2 基于划分的聚类算法276

10.2.1 k-均值算法276

10.2.2 k-中心点算法283

10.3 基于层次的聚类算法285

10.3.1 层次聚类算法概述285

10.3.2 DIANA算法和AGNES算法287

10.3.3 BIRCH算法289

10.3.4 CURE算法292

10.3.5 ROCK算法294

10.3.6 Chameleon算法295

10.4 基于密度的聚类算法299

10.4.1 DBSCAN算法299

10.4.2 OPTICS算法302

10.5 基于网格的聚类算法305

10.5.1 STING算法305

10.5.2 WaveCluster算法307

10.5.3 CLIQUE算法309

10.6 基于模型的聚类算法310

10.6.1 EM算法310

10.6.2 COBWEB算法316

10.7 离群点分析320

10.7.1 离群点概述320

10.7.2 常见的离群点检测方法321

练习题10322

思考题10323

第11章 其他挖掘方法324

11.1 文本挖掘324

11.1.1 文本挖掘概述324

11.1.2 数据预处理技术325

11.1.3 文本结构分析327

11.1.4 文本分类328

11.1.5 文本聚类330

11.1.6 文本摘要332

11.1.7 文本关联分析332

11.2 Web挖掘333

11.2.1 Web挖掘概述333

11.2.2 Web结构挖掘334

11.2.3 Web内容挖掘341

11.2.4 Web使用挖掘341

11.2.5 Web挖掘的发展方向343

11.3 空间数据挖掘343

11.3.1 空间数据概述344

11.3.2 空间数据立方体和空间OLAP345

11.3.3 空间数据挖掘方法346

练习题11348

思考题11348

附录 常用的优化方法350

参考文献354

热门推荐