图书介绍
数据天才 数据科学家修炼之道2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- (美)文森特·格兰维尔(Vincent Granville)著;吴博,张晓峰,季春霖译 著
- 出版社: 北京:电子工业出版社
- ISBN:7121308833
- 出版时间:2017
- 标注页数:331页
- 文件大小:54MB
- 文件页数:356页
- 主题词:
PDF下载
下载说明
数据天才 数据科学家修炼之道PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据科学是什么1
真伪数据科学对比2
伪数据科学的两个例子5
新大学的面貌7
数据科学家10
数据科学家与数据工程师10
数据科学家与统计学家12
数据科学家与业务分析师13
13个真实世界情景中的数据科学应用14
情景1:国家对烈性酒销售的垄断结束后,DUI(酒后驾驶)逮捕量减少15
情景2:数据科学与直觉17
情景3:数据故障将数据变成乱码19
情景4:异常空间的回归21
情景5:分析与诱导在提升销量上有何不同价值22
情景6:关于隐藏数据24
情景7:汽油中的铅会导致高犯罪率。真的吗25
情景8:波音787(梦幻客机)问题26
情景9:NLP的7个棘手句子27
情景10:数据科学家决定着我们所吃的食品28
情景11:用较好的相关性增加亚马逊的销售量30
情景12:检测Facebook上的假档案或假“喜欢”数32
情景13:餐厅的分析33
数据科学的历史、开拓者和现代趋势33
统计学将会复兴34
历史与开拓者36
现代的趋势38
最近的问答讨论40
总结44
第2章 大数据的独特性45
两个大数据的问题45
大数据“诅咒”45
数据快速流动问题50
大数据技术示例56
大数据问题是数据科学所面临挑战的缩影56
大规模数据集的聚类和分类58
1亿行的Excel63
MapReduce不能做什么67
问题67
3种解决方案68
结论:何时使用MapReduce69
沟通问题70
数据科学:统计学的终结72
8种最差的预测建模技术72
把计算机科学、统计学和行业专业知识结合在一起74
大数据生态系统78
总结79
第3章 成为一名数据科学家80
数据科学家的主要特征80
数据科学家的职能80
横向与纵向数据科学家83
数据科学家的类型86
伪数据科学家86
自学成才的数据科学家86
业余数据科学家87
极限数据科学家89
数据科学家人群特征90
数据科学方面的培训91
大学课程91
公司和协会培训项目95
免费培训项目96
数据科学家职业道路98
独立顾问98
创业者105
总结118
第4章 数据科学的技术(Ⅰ)119
新型指标120
优化数字营销活动的指标121
欺诈检测的指标122
选择合适的分析工具124
分析软件124
可视化工具125
实时产品126
编程语言128
可视化128
用R生成数据视频129
更复杂的视频133
无模型的统计建模134
无模型的统计建模是什么135
该算法是如何工作的135
源代码生成数据集137
三类指标:中心性、波动性、颠簸性137
中心性、波动性和颠簸性之间的关系138
定义颠簸性138
在Excel中计算颠簸性139
使用颠簸系数141
大数据的统计聚类141
大数据的相关性和拟合度143
一系列新的秩相关性146
渐近分布与归一化148
计算复杂度152
计算q(n)152
理论上的解决方案155
结构系数156
确定簇的数量157
方法157
例子158
网络拓扑映射159
安全通信:数据加密163
总结166
第5章 数据科学的技术(Ⅱ)167
数据字典168
什么是数据字典168
建立数据字典169
隐性决策树169
实现方法171
示例:互联网流量打分173
结论175
与模型无关的置信区间175
方法175
分析桥第一定理176
应用177
源代码178
随机数179
解决问题的4个办法181
拥有超强直觉能力的业务分析师的直观法182
软件工程师的蒙特卡洛模拟法182
统计学家的统计建模方法183
计算机科学家的大数据方法183
因果关系和相关性183
怎样检测因果关系184
数据科学项目的生命周期186
预测模型的错误189
逻辑相关回归191
变量之间的相互作用191
一阶近似191
二阶近似193
用Excel进行回归分析195
实验设计196
有趣的指标196
把患者分成不同的人群进行治疗196
私人定制的治疗197
分析即服务和应用程序接口198
工作原理199
实施案例199
关键词相关的API的源代码200
其他主题204
当数据库改变时,保存好数值204
优化网络爬虫205
哈希连接206
用于模拟簇的简单源代码207
Hadoop和大数据的新型合成方差208
Hadoop和MapReduce的介绍208
综合指标209
Hadoop、数值的和统计的稳定性210
方差的抽象概念211
一个新的大数据定理213
平移不变性的度量标准214
实现:通信和计算成本214
最终意见215
总结215
第6章 数据科学应用案例研究217
股票市场217
使回报率提高500%的模式217
优化统计交易策略220
股票交易的API:统计模型222
股票交易的API:具体实现225
股票市场模拟226
些许数学知识229
新趋势231
加密232
数据科学应用:隐写术232
好的电子邮件加密236
验证码破解239
欺诈检测240
点击欺诈241
连续点击评分与二进制欺诈/非欺诈242
数学模型与基准244
虚假转化产生的偏差245
一些误解246
统计面临的挑战246
点击评分优化关键词出价247
组合优化自动快速的特征选择249
特征的预测能力:交叉验证250
勾连检测和僵尸网络的关联规则检测254
模式检测的极值理论255
数字分析256
在线广告:到达率和频率的计算公式256
电子邮件营销:提高300%的性能257
在7天内优化关键词广告宣传活动258
自动新闻提要优化260
用bit.ly进行竞争情报分析261
测量Twitter哈希标签(hashtag)的收益263
用3个修补方法提升谷歌搜索267
改进相关性的算法270
广告循环问题272
杂项273
简单模型会获得更好的销售预测273
更好的医疗欺诈检测275
归因模型276
预测陨石撞击277
在路口停车场收集数据281
数据科学的其他应用282
总结282
第7章 踏上你的数据科学职业之路283
面试问题283
关于工作经验的问题283
技术问题285
一般性问题286
关于数据科学项目的问题288
测试你自己的视觉和分析思维291
通过肉眼的检测模式292
识别偏差294
误导性的时间序列和随机游走295
从统计学家到数据科学家296
数据科学家也是统计从业人员297
谁应该给数据科学家教统计学298
雇佣问题298
数据科学家与数据架构师密切合作299
谁应该参与战略思考299
两种类型的统计学家300
大数据与取样301
数据科学家的分类302
数据科学最流行的技能集合302
LinkedIn上的顶级数据科学家306
400个数据科学家职位头衔309
薪酬调查311
根据技能和位置的薪酬分类312
创建自己的薪酬调查表316
总结317
第8章 数据科学资源318
专业资源318
数据集318
书籍319
会议与组织322
网站324
概念定义324
职业建设资源327
招聘数据科学家的公司328
数据科学招聘广告的样本329
简历样本329
总结331
热门推荐
- 1254909.html
- 3846301.html
- 3835364.html
- 3163798.html
- 2610511.html
- 920063.html
- 2093383.html
- 537576.html
- 2206397.html
- 2072363.html
- http://www.ickdjs.cc/book_3837954.html
- http://www.ickdjs.cc/book_3838910.html
- http://www.ickdjs.cc/book_2821489.html
- http://www.ickdjs.cc/book_1749214.html
- http://www.ickdjs.cc/book_2993053.html
- http://www.ickdjs.cc/book_306095.html
- http://www.ickdjs.cc/book_2919338.html
- http://www.ickdjs.cc/book_3436272.html
- http://www.ickdjs.cc/book_2380509.html
- http://www.ickdjs.cc/book_256349.html