图书介绍

IBM SPSS数据分析与挖掘实战案例精粹2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

IBM SPSS数据分析与挖掘实战案例精粹
  • 张文彤,钟云飞编著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302299547
  • 出版时间:2013
  • 标注页数:501页
  • 文件大小:234MB
  • 文件页数:515页
  • 主题词:统计分析-软件包

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

IBM SPSS数据分析与挖掘实战案例精粹PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一部分 SPSS数据分析基础3

第1章 数据分析方法论简介3

1.1 三种数据分析方法论3

1.1.1 严格设计支持下的统计方法论3

1.1.2 半试验研究支持下的统计方法论4

1.1.3 偏智能化、自动化分析的数据挖掘应用方法论5

1.2 CRISP-DM方法论介绍6

1.2.1 概述6

1.2.2 商业理解8

1.2.3 数据理解8

1.2.4 数据准备9

1.2.5 建立模型9

1.2.6 模型评价9

1.2.7 结果部署10

第2章 数据分析方法体系简介11

2.1 统计软件中的数据存储格式11

2.1.1 二维数据表11

2.1.2 变量的存储类型12

2.1.3 变量的测量尺度12

2.2 数据的统计描述与参数估计13

2.2.1 连续变量的统计描述13

2.2.2 连续变量的参数估计16

2.2.3 分类变量的统计描述和参数估计18

2.2.4 统计图形体系21

2.3 常用假设检验方法24

2.3.1 假设检验的基本原理25

2.3.2 单变量假设检验方法26

2.3.3 双变量假设检验方法28

2.4 多变量模型31

2.4.1 方差分析/一般线性模型31

2.4.2 广义线性模型和混合线性模型32

2.4.3 回归模型34

2.4.4 其他常见模型36

2.5 多元统计分析模型38

2.5.1 信息浓缩38

2.5.2 变量间内在关联结构的探讨38

2.5.3 数据分类39

2.5.4 分析元素间的关联41

2.6 智能统计分析/数据挖掘方法42

2.6.1 树模型42

2.6.2 神经网络43

2.6.3 支持向量机43

2.6.4 贝叶斯网络44

2.6.5 最近邻元素分析44

2.6.6 关联规则与序列分析44

第3章 IBM SPSS Statistics操作入门46

3.1 案例背景46

3.2 数据文件的读入与变量整理47

3.2.1 SPSS的基本操作界面47

3.2.2 数据准备49

3.3 问卷数据分析53

3.3.1 生成频数表53

3.3.2 计算均值54

3.3.3 对多选题进行描述55

3.4 项目总结和讨论56

第4章 IBM SPSS Statistics操作进阶57

4.1 案例背景57

4.1.1 项目背景57

4.1.2 分析思路59

4.2 问卷录入59

4.2.1 开放题的定义59

4.2.2 单选题的定义60

4.2.3 多选题的定义60

4.3 问卷质量校验62

4.3.1 去除重复记录62

4.3.2 发现异常值64

4.3.3 逻辑校验65

4.4 问卷数据分析67

4.4.1 问卷加权67

4.4.2 业务分析70

4.5 项目总结和讨论71

第5章 IBM SPSS Modeler操作入门73

5.1 IBM SPSS Modeler概述73

5.1.1 IBM SPSS Modeler的界面73

5.1.2 IBM SPSS Modeler的架构与产品构成76

5.2 IBM SPSS Modeler相关操作与技巧77

5.2.1 IBM SPSS Modeler的基本操作77

5.2.2 IBM SPSS Modeler中的表达式79

5.2.3 IBM SPSS Modeler的若干使用技巧79

5.3 IBM SPSS Modeler功能介绍81

5.3.1 数据整理案例81

5.3.2 探索性数据分析案例82

5.3.3 建立模型、模型检验与模型应用案例83

5.4 案例分析:药物选择决策支持86

5.4.1 背景介绍86

5.4.2 数据说明86

5.4.3 商业理解87

5.4.4 数据理解87

5.4.5 数据准备88

5.4.6 模型建立和评估89

5.4.7 模型发布91

5.5 如何进一步学习IBM SPSS Modeler93

第二部分 影响因素发现与数值预测97

第6章 酸奶饮料新产品口味测试研究案例97

6.1 案例背景97

6.1.1 研究项目概况97

6.1.2 分析思路与商业理解98

6.2 数据理解98

6.2.1 研究设计框架复查98

6.2.2 均值的列表描述99

6.2.3 均值的图形描述101

6.3 不同品牌的评分差异分析102

6.3.1 单因素方差分析模型简介103

6.3.2 品牌作用的总体检验104

6.3.3 组间两两比较105

6.3.4 方差齐性检验108

6.4 两因素方差分析模型分析108

6.4.1 两因素方差分析模型简介109

6.4.2 拟合包括交互项的饱和模型110

6.4.3 拟合只包含主效应的模型111

6.4.4 组间两两比较112

6.4.5 随机因素分析114

6.5 分析结论与讨论116

6.5.1 分析结论116

6.5.2 Benchmark:用还是不用116

第7章 偏态分布的激素水平影响因素分析118

7.1 案例背景118

7.1.1 研究项目概况118

7.1.2 分析思路与商业理解119

7.2 数据理解119

7.2.1 单变量描述119

7.2.2 变量关联探索122

7.3 对因变量变换后的建模分析127

7.3.1 常见的变量变换方法127

7.3.2 本案例的具体操作128

7.4 秩变换分析131

7.5 利用Cox模型进行分析132

7.5.1 Cox回归模型的基本原理133

7.5.2 本案例的具体操作134

7.6 项目总结与讨论136

7.6.1 分析结论136

7.6.2 如何正确选择分析模型136

第8章 某车企汽车年销量预测案例138

8.1 案例背景138

8.1.1 研究项目概况138

8.1.2 分析思路和商业理解139

8.2 数据理解140

8.3 变量变换后的线性回归142

8.3.1 线性回归模型简介142

8.3.2 变量变换后拟合线性回归模型143

8.3.3 模型拟合效果的判断146

8.3.4 存储预测值和区间估计值148

8.4 曲线拟合148

8.4.1 用曲线估计过程同时拟合多个曲线模型149

8.4.2 模型拟合效果的判断151

8.4.3 模型的预测153

8.5 利用非线性回归进行拟合154

8.5.1 模型简介154

8.5.2 构建分段回归模型155

8.5.3 不同模型效果的比较157

8.6 项目总结与讨论158

8.6.1 分析结论158

8.6.2 行走在理想与现实之间158

第9章 脑外伤急救后迟发性颅脑损伤影响因素分析案例160

9.1 案例背景160

9.1.1 研究项目概况160

9.1.2 分析思路和商业理解161

9.2 数据理解161

9.2.1 变量关联的图表描述161

9.2.2 变量关联的单变量检验164

9.3 构建二分类Logistic回归模型167

9.3.1 模型简介167

9.3.2 初步尝试建模169

9.3.3 构建最终模型174

9.4 利用树模型发现交互项175

9.4.1 模型简介176

9.4.2 进行树模型分析178

9.5 使用广义线性过程进行分析181

9.5.1 模型简介181

9.5.2 构建仅包括主效应的模型182

9.5.3 在模型中加入交互项185

9.6 项目总结与讨论186

9.6.1 分析结论186

9.6.2 尺有所短,寸有所长187

第10章 中国消费者信心指数影响因素分析188

10.1 案例背景188

10.1.1 项目背景188

10.1.2 项目问卷189

10.1.3 分析思路和商业理解192

10.2 数据理解193

10.2.1 考察时间、地域对信心指数的影响193

10.2.2 考察性别、职业、婚姻状况等对信心指数的影响195

10.2.3 考察年龄对信心指数的影响196

10.3 标准GLM框架下的建模分析197

10.3.1 建立总模型197

10.3.2 两两比较的结果200

10.4 多元方差分析模型的结果202

10.4.1 模型简介202

10.4.2 拟合多元方差分析模型203

10.5 最优尺度回归209

10.5.1 方法简介210

10.5.2 利用最优尺度回归进行分析211

10.6 多水平模型框架下的建模分析214

10.6.1 模型简介215

10.6.2 针对时间拟合多水平模型216

10.7 项目总结与讨论221

10.7.1 分析结论221

10.7.2 什么时候运用复杂模型来建模222

第三部分 信息浓缩、分类与感知图呈现225

第11章 探讨消费者购买保健品的动机225

11.1 案例背景225

11.1.1 研究项目概况225

11.1.2 分析思路和商业理解227

11.2 数据理解227

11.2.1 单变量描述227

11.2.2 变量关联探索228

11.3 利用因子分析进行信息浓缩229

11.3.1 模型简介229

11.3.2 因子分析的具体操作231

11.4 基于因子分析结果进行市场细分238

11.4.1 不同婚姻状况受访者的差异238

11.4.2 不同品牌保健品使用者的因子偏好差异240

11.5 项目总结与讨论241

11.5.1 研究结论241

11.5.2 合理解读因子分析的结果242

第12章 1988年汉城奥运会男子十项全能成绩分析244

12.1 案例背景244

12.1.1 项目概况244

12.1.2 分析思路和商业理解245

12.2 数据理解246

12.2.1 单变量描述246

12.2.2 变量关联性探索246

12.2.3 尝试初步建模247

12.3 利用因子分析进行信息浓缩249

12.3.1 初步分析249

12.3.2 因子旋转252

12.3.3 继续寻找更好的分析结果253

12.3.4 结果存储与发布254

12.4 主成分回归255

12.5 将主成分回归方程还原回原始变量的形式257

12.6 项目总结与讨论257

12.6.1 研究结论257

12.6.2 正确诠释因子的方差解释比例258

第13章 打败SARS259

13.1 案例背景259

13.1.1 研究项目概况259

13.1.2 分析思路和商业理解262

13.2 数据理解与数据准备263

13.2.1 消费者关注的信息263

13.2.2 突发事件保险产品购买倾向265

13.2.3 未来消费者生活方式的变化267

13.3 “非典”信息关注倾向的多维偏好分析269

13.3.1 模型简介269

13.3.2 多维偏好分析的SPSS操作270

13.3.3 尝试初步建模272

13.3.4 引入更多的背景变量275

13.4 突发事件险种购买倾向的多重对应分析278

13.4.1 模型简介278

13.4.2 简单对应分析280

13.4.3 多重对应分析284

13.5 “非典”对未来生活方式的影响289

13.5.1 采用多维偏好分析进行初步探索289

13.5.2 换用因子分析进行信息汇总291

13.6 项目总结与讨论295

13.6.1 研究结论295

13.6.2 对多维偏好分析等信息浓缩方法本质的讨论297

第14章 住院费用影响因素挖掘299

14.1 案例背景299

14.1.1 项目概况299

14.1.2 分析思路/商业理解302

14.2 数据理解与数据准备303

14.2.1 费用数据分布303

14.2.2 变量合并305

14.2.3 极端值清理306

14.2.4 病种分布考察306

14.2.5 变量变换307

14.3 采用聚类分析寻找费用类型308

14.3.1 用因子分析汇总信息308

14.3.2 聚类分析方法简介310

14.3.3 对费用数据进行聚类分析312

14.4 住院费用影响因素的神经网络分析315

14.4.1 模型简介316

14.4.2 初步尝试用神经网络建模318

14.4.3 对年龄离散化后重新建模323

14.4.4 构建双因变量神经网络325

14.4.5 进一步寻找更清晰的结果解释327

14.5 不同疗法疗效与费用比较的神经网络分析328

14.5.1 生成工作用数据集329

14.5.2 进行神经网络的建模预测330

14.5.3 模型预测值的比较332

14.6 项目总结与讨论334

14.6.1 研究结论334

14.6.2 数据挖掘方法和经典方法的取舍335

第四部分 数据挖掘案例精选339

第15章 淘宝大卖家之营销数据分析339

15.1 案例背景339

15.1.1 卖家张三339

15.1.2 分析思路和商业理解340

15.2 利用RFM模型定位促销名单341

15.2.1 RFM模型简介341

15.2.2 对数据进行RFM模型分析343

15.3 寻找有重购行为买家的特征348

15.3.1 数据理解与数据准备348

15.3.2 利用直销模块寻找重购人群的特征354

15.4 总结与讨论356

15.4.1 可使用的其他营销分析方法356

15.4.2 研究总结357

第16章 超市商品购买关联分析358

16.1 案例背景358

16.1.1 研究背景358

16.1.2 分析思路和商业理解358

16.2 数据准备359

16.3 商品购买关联分析362

16.3.1 几种典型关联算法介绍362

16.3.2 商品购买关联分析364

16.4 结果应用369

第17章 电信业客户流失分析370

17.1 案例背景370

17.2 商业理解371

17.2.1 如何定义流失372

17.2.2 哪些变量可用于预测流失372

17.2.3 如何定义分析用数据的时间窗口373

17.2.4 如何从分析结果中获取实际收益374

17.3 数据理解与数据准备374

17.3.1 分析的数据基础374

17.3.2 生成数据挖掘宽表376

17.3.3 数据探索性分析382

17.4 建立模型与模型评估390

17.4.1 模型的选择390

17.4.2 建模思路1:聚类392

17.4.3 建模思路2:用决策树生成规则集394

17.4.4 建模思路3:用神经网络生成流失评分395

17.5 模型的应用及营销预演399

17.6 总结与讨论401

17.6.1 研究总结401

17.6.2 进一步阅读402

第18章 信用风险评分方法403

18.1 案例背景403

18.1.1 引言403

18.1.2 信用评分的方法405

18.2 商业理解406

18.3 数据理解与数据准备409

18.4 建立模型与模型评估410

18.4.1 对输入变量分箱411

18.4.2 用Logistic回归建立信用预测模型415

18.4.3 生成信用评分模型417

18.4.4 模型检验420

18.5 对若干问题的说明422

18.5.1 拒绝推断422

18.5.2 模型的监控423

18.5.3 进一步阅读424

第19章 医疗保险业的欺诈发现425

19.1 案例背景425

19.2 商业理解426

19.3 数据理解与数据准备427

19.3.1 数据集概况427

19.3.2 对数据进行描述429

19.3.3 对数据源合并的考虑431

19.4 建立模型432

19.4.1 进行欺诈发现的若干技术思路和方法432

19.4.2 模型1:变量对比发现疑似欺诈434

19.4.3 模型2:通过Benford定律发现疑似欺诈436

19.4.4 模型3:通过对投保人细分发现疑似欺诈439

19.4.5 模型4:发现医疗保健机构行为模式异常441

19.4.6 模型5:使用关联规则发现多个医保机构共用投保人信息441

19.4.7 模型6:发现异常诊断与处理过程442

19.5 结果发布444

19.6 进一步阅读445

第20章 电子商务中的数据挖掘应用446

20.1 案例背景446

20.1.1 引言446

20.1.2 网络数据分析的分类447

20.2 数据理解448

20.2.1 分析的数据基础448

20.2.2 网络数据的常见来源450

20.3 数据准备452

20.3.1 识别访问用户453

20.3.2 从网络日志中提取有用信息454

20.3.3 合并网络日志与相关数据455

20.4 建立模型与模型发布455

20.4.1 对访问建立模型456

20.4.2 自动选择模型功能及组合模型的应用459

20.4.3 对访问者建立模型462

20.4.4 产品特征模型464

20.5 进一步阅读465

附录469

附录A 本书光盘内容介绍469

附录B SPSS软件的安装与激活470

附录C 书中统计方法、模型与知识点索引472

附录D IBM SPSS Statistics函数一览表474

附录E IBM SPSS Modeler节点功能简介485

参考文献495

后记498

热门推荐