图书介绍
R数据科学2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- (新西兰)哈德利·威克姆(Hadley Wickham),(美)加勒特·格罗勒芒德 著
- 出版社: 北京:人民邮电出版社
- ISBN:9787115486394
- 出版时间:2018
- 标注页数:342页
- 文件大小:31MB
- 文件页数:371页
- 主题词:程序语言-程序设计
PDF下载
下载说明
R数据科学PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第一部分 探索3
第1章 使用ggplot2进行数据可视化3
1.1 简介3
1.2 第一步4
1.2.1 mpg数据框4
1.2.2 创建ggplot图形5
1.2.3 绘图模板5
1.2.4 练习6
1.3 图形属性映射6
1.4 常见问题10
1.5 分面11
1.6 几何对象13
1.7 统计变换18
1.8 位置调整21
1.9 坐标系25
1.10 图形分层语法27
第2章 工作流:基础29
2.1 代码基础29
2.2 对象名称30
2.3 函数调用30
第3章 使用dplyr进行数据转换33
3.1 简介33
3.1.1 准备工作33
3.1.2 nycflights1333
3.1.3 dplyr基础34
3.2 使用filter()筛选行35
3.2.1 比较运算符36
3.2.2 逻辑运算符36
3.2.3 缺失值37
3.2.4 练习38
3.3 使用arrange()排列行39
3.4 使用sel.ect()选择列40
3.5 使用mutate()添加新变量42
3.5.1 常用创建函数43
3.5.2 练习45
3.6 使用summarize()进行分组摘要46
3.6.1 使用管道组合多种操作46
3.6.2 缺失值48
3.6.3 计数49
3.6.4 常用的摘要函数52
3.6.5 按多个变量分组56
3.6.6 取消分组57
3.6.7 练习57
3.7 分组新变量(和筛选器)58
第4章 工作流:脚本60
4.1 运行代码61
4.2 RStudio自动诊断61
第5章 探索性数据分析63
5.1 简介63
5.2 问题64
5.3 变动64
5.3.1 对分布进行可视化表示65
5.3.2 典型值67
5.3.3 异常值69
5.3.4 练习70
5.4 缺失值71
5.5 相关变动72
5.5.1 分类变量与连续变量72
5.5.2 两个分类变量77
5.5.3 两个连续变量79
5.6 模式和模型82
5.7 ggplot2调用84
5.8 更多学习资源85
第6章 工作流:项目86
6.1 什么是真实的86
6.2 你的分析位于哪里87
6.3 路径与目录88
6.4 RStudio项目88
6.5 小结90
第二部分 数据处理93
第7章 使用tibble实现简单数据框93
7.1 简介93
7.2 创建tibble93
7.3 对比tibble与data.frame95
7.3.1 打印95
7.3.2 取子集96
7.4 与旧代码进行交互96
第8章 使用readr进行数据导入98
8.1 简介98
8.2 入门98
8.2.1 与R基础包进行比较100
8.2.2 练习101
8.3 解析向量101
8.3.1 数值102
8.3.2 字符串103
8.3.3 因子105
8.3.4 日期、日期时间与时间105
8.3.5 练习107
8.4 解析文件107
8.4.1 策略107
8.4.2 问题108
8.4.3 其他策略110
8.5 写入文件112
8.6 其他类型的数据113
第9章 使用dplyr处理关系数据114
9.1 简介114
9.2 nycflights13115
9.3 键117
9.4 合并连接119
9.4.1 理解连接120
9.4.2 内连接121
9.4.3 外连接121
9.4.4 重复键122
9.4.5 定义键列124
9.4.6 练习125
9.4.7 其他实现方式126
9.5 筛选连接127
9.6 连接中的问题129
9.7 集合操作130
第10章 使用stringr处理字符串131
10.1 简介131
10.2 字符串基础131
10.2.1 字符串长度132
10.2.2 字符串组合133
10.2.3 字符串取子集133
10.2.4 区域设置134
10.2.5 练习134
10.3 使用正则表达式进行模式匹配135
10.3.1 基础匹配135
10.3.2 练习136
10.3.3 锚点136
10.3.4 练习137
10.3.5 字符类与字符选项137
10.3.6 练习138
10.3.7 重复138
10.3.8 练习139
10.3.9 分组与回溯引用140
10.3.10 练习140
10.4 工具140
10.4.1 匹配检测142
10.4.2 练习143
10.4.3 提取匹配内容144
10.4.4 练习145
10.4.5 分组匹配145
10.4.6 练习147
10.4.7 替换匹配内容147
10.4.8 练习147
10.4.9 拆分147
10.4.10 练习149
10.4.11 定位匹配内容149
10.5 其他类型的模式149
10.6 正则表达式的其他应用152
10.7 stringi152
第11章 使用forcats处理因子154
11.1 简介154
11.2 创建因子154
11.3 综合社会调查156
11.4 修改因子水平157
第12章 使用Iubridate处理日期和时间160
12.1 简介160
12.2 创建日期或时间161
12.2.1 通过字符串创建161
12.2.2 通过各个成分创建162
12.2.3 通过其他类型数据创建164
12.2.4 练习165
12.3 日期时间成分165
12.3.1 获取成分165
12.3.2 舍入168
12.3.3 设置成分168
12.3.4 练习170
12.4 时间间隔170
12.4.1 时期170
12.4.2 阶段171
12.4.3 区间173
12.4.4 小结173
12.4.5 练习174
12.5 时区174
第三部分 编程179
第13章 使用magrittr进行管道操作179
13.1 简介179
13.2 管道的替代方式179
13.2.1 中间步骤180
13.2.2 重写初始对象181
13.2.3 函数组合181
13.2.4 使用管道182
13.3 不适合使用管道的情形183
13.4 magrittr中的其他工具183
第14章 函数185
14.1 简介185
14.2 什么时候应该使用函数186
14.3 人与计算机的函数188
14.4 条件执行190
14.4.1 条件191
14.4.2 多重条件192
14.4.3 代码风格192
14.4.4 练习193
14.5 函数参数194
14.5.1 选择参数名称195
14.5.2 检查参数值195
14.5.3 点点点(...)197
14.5.4 惰性求值197
14.5.5 练习198
14.6 返回值198
14.6.1 显式返回语句198
14.6.2 使得函数支持管道199
14.7 环境200
第15章 向量201
15.1 简介201
15.2 向量基础202
15.3 重要的原子向量203
15.3.1 逻辑型203
15.3.2 数值型203
15.3.3 字符型204
15.3.4 缺失值204
15.3.5 练习204
15.4 使用原子向量205
15.4.1 强制转换205
15.4.2 检验函数206
15.4.3 标量与循环规则206
15.4.4 向量命名208
15.4.5 向量取子集208
15.4.6 练习209
15.5 递归向量(列表)210
15.5.1 列表可视化211
15.5.2 列表取子集211
15.5.3 调料列表212
15.5.4 练习214
15.6 特性214
15.7 扩展向量216
15.7.1 因子216
15.7.2 日期和日期时间216
15.7.3 tibble217
15.7.4 练习218
第16章 使用purrr实现迭代219
16.1 简介219
16.2 for循环220
16.3 for循环的变体222
16.3.1 修改现有对象222
16.3.2 循环模式223
16.3.3 未知的输出长度223
16.3.4 未知的序列长度224
16.3.5 练习225
16.4 for循环与函数式编程226
16.5 映射函数228
16.5.1 快捷方式229
16.5.2 R基础包230
16.5.3 练习231
16.6 对操作失败的处理231
16.7 多参数映射233
16.8 游走函数236
16.9 for循环的其他模式237
16.9.1 预测函数237
16.9.2 归约与累计238
16.9.3 练习239
第四部分 模型243
第17章 使用modelr实现基础模型243
17.1 简介243
17.2 一个简单模型244
17.3 模型可视化250
17.3.1 预测250
17.3.2 残差252
17.3.3 练习253
17.4 公式和模型族254
17.4.1 分类变量255
17.4.2 交互项(连续变量与分类变量)256
17.4.3 交互项(两个连续变量)259
17.4.4 变量转换261
17.4.5 练习264
17.5 缺失值264
17.6 其他模型族265
第18章 模型构建266
18.1 简介266
18.2 为什么质量差的钻石更贵267
18.2.1 价格与重量268
18.2.2 一个更复杂的模型271
18.2.3 练习273
18.3 哪些因素影响了每日航班数量273
18.3.1 一周中的每一天274
18.3.2 季节性星期六效应277
18.3.3 计算出的变量280
18.3.4 年度时间:另一种方法281
18.3.5 练习282
18.4 学习更多模型知识282
第19章 使用purrr和broom处理多个模型284
19.1 简介284
19.2 列表列285
19.3 创建列表列286
19.3.1 使用嵌套286
19.3.2 使用向量化函数287
19.3.3 使用多值摘要288
19.3.4 使用命名列表288
19.3.5 练习289
19.4 简化列表列290
19.4.1 列表转换为向量290
19.4.2 嵌套还原291
19.4.3 练习292
19.5 使用broom生成整洁数据292
第五部分 沟通295
第20章 R Markdown295
20.1 简介295
20.2 R Markdown基础295
20.3 使用Markdown格式化文本298
20.4 代码段299
20.4.1 代码段名称300
20.4.2 代码段选项300
20.4.3 表格301
20.4.4 缓存301
20.4.5 全局选项302
20.4.6 内联代码303
20.4.7 练习303
20.5 排错304
20.6 YAML文件头304
20.6.1 文档参数304
20.6.2 参考文献与引用306
20.7 更多学习资源307
第21章 使用ggplot2进行图形化沟通308
21.1 简介308
21.2 标签309
21.3 注释311
21.4 标度316
21.4.1 坐标轴刻度与图例项目316
21.4.2 图例布局318
21.4.3 标度替换320
21.4.4 练习324
21.5 缩放325
21.6 主题326
21.7 保存图形328
21.7.1 图形大小328
21.7.2 其他重要选项330
21.8 更多学习资源330
第22章 R Markdown输出类型331
22.1 简介331
22.2 输出选项332
22.3 文档332
22.4 笔记本333
22.5 演示文稿333
22.6 仪表盘334
22.7 交互元素335
22.7.1 htmlwidgets335
22.7.2 Shiny336
22.8 网站337
22.9 其他类型338
22.10 更多学习资源338
第23章 R Markdown工作流339
作者简介341
封面简介341
热门推荐
- 3443978.html
- 2083529.html
- 2609751.html
- 1987108.html
- 3298574.html
- 460793.html
- 1639678.html
- 611864.html
- 1451871.html
- 3646910.html
- http://www.ickdjs.cc/book_222283.html
- http://www.ickdjs.cc/book_13596.html
- http://www.ickdjs.cc/book_1047454.html
- http://www.ickdjs.cc/book_3199229.html
- http://www.ickdjs.cc/book_1075042.html
- http://www.ickdjs.cc/book_2053723.html
- http://www.ickdjs.cc/book_690796.html
- http://www.ickdjs.cc/book_1314729.html
- http://www.ickdjs.cc/book_3516231.html
- http://www.ickdjs.cc/book_119805.html