图书介绍

异构处理器OpenCL编程导论2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

异构处理器OpenCL编程导论
  • 邓仰东,朱茂华,刘春峰编著 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111543305
  • 出版时间:2016
  • 标注页数:238页
  • 文件大小:95MB
  • 文件页数:250页
  • 主题词:图形软件-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

异构处理器OpenCL编程导论PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 GPU计算的发展历程1

1.1 计算机图形学的发展2

1.2 图形流水线6

1.3 GPU的发展过程8

1.4 GPU通用计算的发展历程15

参考文献18

第2章 现代图形处理器的体系结构20

2.1 计算机体系结构基础21

2.2 GPU的设计思想23

2.3 NVIDIA图形处理器25

2.3.1 总体体系结构26

2.3.2 流多处理器29

2.3.3 流多处理器的扩展31

2.3.4 存储器34

2.4 AMD Graphics Core Next图形处理器体系结构37

2.4.1 GCN计算单元38

2.4.2 GCN缓存40

2.4.3 GCN GPU41

2.5 Imagination PowerVR移动图形处理器体系结构42

参考文献44

第3章 异构系统体系结构和融合处理器45

3.1 HSA基本概念47

3.2 异构系统体系结构存储器模型50

3.2.1 虚拟存储器的地址空间51

3.2.2 缓存一致性52

3.2.3 内存一致性53

3.3 异构任务队列式调度机制54

3.4 任务抢占和内容切换57

3.5 HSA中间语言57

3.6 AMD的HSA硬件60

习题62

参考文献63

第4章 OpenCL基本概念64

4.1 OpenCL程序的工作流程64

4.2 OpenCL平台与设备65

4.3 上下文、命令队列、kernel函数70

4.4 存储对象72

4.5 Hello World例程73

习题82

参考文献82

第5章 OpenCL并行编程基础83

5.1 并行线程组织83

5.2 OpenCL存储器模型86

5.3 数据类型88

5.4 运算符92

5.5 函数93

5.6 矢量相加例程96

5.7 矩阵相乘的OpenCL例程98

5.7.1 矩阵相乘OpenCL代码98

5.7.2 矩阵相乘分块计算的OpenCL代码100

5.7.3 提高计算密度的分块矩阵相乘102

5.7.4 使用矢量计算的分块矩阵相乘105

习题107

参考文献107

第6章 OpenCL事件和队列108

6.1 命令、命令队列和事件109

6.2 事件的定义和基本用法112

6.3 事件对象与用户事件115

6.4 双设备队列管理例程115

6.5 使用事件进行性能剖析例程116

习题118

参考文献118

第7章 OpenCL 2.0高级特征119

7.1 共享虚拟存储器119

7.1.1 粗粒度缓冲区共享虚拟存储器120

7.1.2 细粒度缓冲区共享虚拟存储器122

7.1.3 细粒度系统级共享虚拟存储器126

7.2 管道127

7.3 嵌套并行129

7.4 工作组函数130

7.5 通用地址空间131

习题132

参考文献133

第8章 并行程序设计方法134

8.1 并行程序设计的复杂性134

8.2 程序性能剖析135

8.2.1 程序执行时间135

8.2.2 程序性能剖析的概念136

8.2.3 使用gprof剖析程序性能137

8.2.4 解读性能剖析结果139

8.3 寻找并行性140

8.3.1 可行性分析140

8.3.2 数据依赖性141

8.4 并行化实例142

8.4.1 顺序逻辑仿真算法144

8.4.2 同步并行逻辑仿真145

8.4.3 保守型并行逻辑仿真145

8.5 并行化设计方法学146

8.6 降低并行程序的开发难度148

习题149

参考文献和深入阅读150

第9章 N体问题152

9.1 串行算法153

9.2 GPU端OpenCL程序155

9.3 CPU端OpenCL程序157

9.4 双GPU的OpenCL程序160

习题164

参考文献164

第10章 归约问题165

10.1 直观并行归约算法166

10.2 减少闲置线程168

10.3 改进局部内存访问169

10.4 避免内存访问冲突171

10.5 减少同步操作172

10.6 优化顺序和并行工作比例174

习题177

参考文献177

第11章 快速傅里叶变换178

11.1 傅里叶变换原理179

11.2 快速傅里叶变换算法180

11.3 简化基-2 FFT算法内核183

11.4 通用基-2 FFT算法内核184

11.4.1 Twiddle因子184

11.4.2 数据访问模式185

11.4.3 64点FFT187

习题190

参考文献190

第12章 稀疏矩阵——向量积191

12.1 稀疏矩阵数据格式192

12.2 对角稀疏矩阵195

12.3 COO格式稀疏矩阵201

12.4 CSR格式稀疏矩阵203

12.5 ELL格式稀疏矩阵206

习题207

参考文献207

第13章 直方图208

13.1 直方图的计算209

13.2 简单的并行直方图计算210

13.3 数据值范围较小情形下的直方图算法212

13.4 数据值范围较大情形下的加权直方图算法214

习题216

参考文献216

第14章 光线追踪算法的OpenCL实现217

14.1 光线追踪算法综述219

14.2 光线追踪流水线解析224

14.3 OpenCL光线追踪程序228

14.3.1 代码框架228

14.3.2 主机端代码及详解229

14.3.3 设备端代码及详解232

参考文献237

热门推荐