图书介绍

大数据治理2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

大数据治理
  • (美)桑尼尔·索雷斯著;匡斌译 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302364061
  • 出版时间:2014
  • 标注页数:286页
  • 文件大小:68MB
  • 文件页数:315页
  • 主题词:数据管理-研究

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

大数据治理PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一部分 开篇3

第1章 大数据治理概述3

第2章 大数据治理的框架8

2.1 大数据类型9

2.2 信息治理准则11

2.3 大数据治理的产业和功能场景13

第3章 成熟度评估28

3.1 IBM信息治理委员会的成熟度模型28

3.2 评估成熟度的示例问题30

第4章 业务案例36

4.1 通过大数据治理,提高运营实时性和旅客安全度37

4.2 量化大数据治理对客户隐私的财务影响38

4.3 通过治理大数据生命周期,降低IT成本39

4.4 评估数据质量和主数据对大数据计划的影响40

4.5 计算大数据质量的价值41

第5章 路线图43

5.1 路线图案例研究43

第二部分 大数据治理准则49

第6章 大数据治理的组织49

6.1 绘制关键流程图并建立职责分配模型,以识别大数据治理中的利益攸关者50

6.2 确定新角色和既有角色的适当组合54

6.3 酌情任命大数据主管54

6.4 在传统信息治理角色的基础上,酌情增加大数据责任59

6.5 建立承担包括大数据在内的责任混合式信息治理组织62

第7章 元数据65

7.1 创建一个体现关键大数据术语的业务定义的词库66

7.2 理解对Apache Hadoop中元数据的持续支持69

7.3 对业务词库中的敏感大数据进行标记71

7.4 从相关的大数据存储中输入技术元数据72

7.5 将相关的数据源与业务词库中的术语进行链接72

7.6 使用运营元数据监测大数据的流动72

7.7 保留技术元数据,以支持数据血统和影响分析73

7.8 从非结构化文件中采集元数据,支持企业搜索75

7.9 扩展既有的元数据角色,将大数据纳入其中75

第8章 大数据隐私77

8.1 识别敏感的大数据82

8.2 对元数据库中的敏感大数据进行标记84

8.3 应对国家、州(省)层面的隐私立法和隐私限制85

8.4 管理个人数据跨国界流动的情况94

8.5 监控特权用户对敏感大数据的访问96

第9章 大数据质量98

9.1 与商业上的利益攸关者协作,建立并测度大数据质量的置信区间99

9.2 利用准结构化和非结构化数据,提高人口稀疏的结构化数据的质量104

9.3 使用流数据分析技术解决内存中的数据质量问题,无须将中间结果输入硬盘104

9.4 任命对信息治理委员会负责的数据主管,由其负责提高测度的质量108

第10章 业务流程整合111

10.1 识别将会受到大数据治理影响的关键流程112

10.2 建立关键活动的流程图113

10.3 针对业务流程中的关键步骤,制定大数据治理政策113

第11章 主数据整合115

11.1 提高主数据的质量,以支持大数据分析117

11.2 利用大数据提高主数据的质量119

11.3 提高关键参考数据的质量和一致性,以支持大数据治理计划122

11.4 审视社交媒体平台政策,以确定与主数据管理整合的程度123

11.5 从非结构化文本中挖掘有用信息,以丰富主数据124

第12章 管理大数据的生命周期130

12.1 基于规制和业务要求,扩展保留时间表,将大数据包含其中131

12.2 提供法律保留区,并支持电子证据展示(eDiscovery)134

12.3 压缩大数据并将其存档,降低IT成本,提高应用绩效134

12.4 管理实时流数据的生命周期136

12.5 保留社交媒体记录,以符合规制要求,并支持电子证据展示137

12.6 基于规制和业务要求,正当合理地处置不再需要的大数据137

第三部分 大数据的类型141

第13章 Web和社交媒体数据141

13.1 在制定有关客户社交媒体数据的可接受使用的政策时,考虑不断变化的规制和习俗143

13.2 制定有关雇员和求职者社交媒体数据的可接受使用的政策148

13.3 利用置信区间评估社交媒体数据的质量150

13.4 制定有关Cookies与其他Web跟踪装置的可接受使用的政策152

13.5 在不侵犯隐私并遵从规制要求的基础上,定义连接在线和离线数据的政策159

13.6 确保网络统计数据的一致性162

第14章 机器对机器的数据165

14.1 评估目前可用的地理位置数据166

14.2 制定关于客户地理位置数据的可接受使用的政策168

14.3 制定关于雇员地理位置数据的可接受使用的政策171

14.4 保证RFID数据的隐私安全172

14.5 制定与其他类型M2M数据的隐私相关的政策174

14.6 处理元数据和M2M数据的质量问题177

14.7 制定与M2M数据的保留期有关的政策180

14.8 提高主数据的质量,以支持M2M计划180

14.9 确保SCADA设施免遭网络攻击182

第15章 大体量交易数据188

第16章 生物计量学数据194

16.1 评估与生物计量学数据的可接受使用相关的隐私含义195

16.2 与法律顾问通力合作,确定演进中的规制对使用客户和雇员生物计量学数据的影响196

第17章 人工生成的数据200

17.1 制定屏蔽敏感的人工生成数据的政策201

17.2 使用非结构化的人工生成数据,提高结构化数据的质量202

17.3 管理人工生成数据的生命周期,降低成本并遵循规制要求203

17.4 从非结构化的人工生成数据中获得洞察力,以丰富MDM204

第四部分 行业视角207

第18章 医疗保健机构207

18.1 利用非结构化数据,提高人口稀疏的结构化数据的质量208

18.2 提取从结构化数据中无法获得的更多临床因素209

18.3 设定关键业务术语的一致性定义210

18.4 确保跨科室的患者主数据的一致性210

18.5 与美国HIPAA的规定一致,符合受保护的健康信息的隐私要求210

18.6 创造性管理参考数据,以获得更多临床洞察211

第19章 公用事业部门212

19.1 复制仪表读数215

19.2 主关键字的参照完整性215

19.3 异常的仪表读数216

19.4 客户地址的数据质量216

19.5 信息生命周期管理217

19.6 数据库监测217

19.7 技术架构218

第20章 通信服务提供商220

20.1 大数据类型221

20.2 将大数据与主数据进行整合222

20.3 大数据隐私224

20.4 大数据质量225

20.5 大数据生命周期管理226

第五部分 大数据技术231

第21章 大数据的参考架构231

21.1 大数据源233

21.2 开源基础组件233

21.3 Hadoop发行版235

21.4 流数据分析236

21.5 数据库237

21.6 大数据整合238

21.7 文本分析240

21.8 大数据发现241

21.9 大数据质量242

21.10 大数据的元数据243

21.11 信息政策管理243

21.12 主数据管理244

21.13 数据仓库与数据集市245

21.14 大数据分析与报告246

21.15 大数据安全与隐私248

21.16 大数据生命周期管理249

21.17 云252

第22章 大数据平台254

22.1 IBM255

22.2 甲骨文260

22.3 SAP264

22.4 微软267

22.5 HP269

22.6 Informatica270

22.7 SAS274

22.8 Teradata275

22.9 EMC275

22.10 Amazon276

22.11 谷歌276

22.12 Pentaho277

22.13 Talend277

附录 缩略语列表279

译者后记284

热门推荐