图书介绍

面向千万亿次计算的算法与应用2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

（美）巴德尔（Bader，D.A.）著；都志辉等译著
出版社：北京：清华大学出版社
ISBN：9787302177227
出版时间：2008
标注页数：356页
文件大小：52MB
文件页数：379页
主题词：电子计算机－算法理论

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：926834335e0e30535579e0481360d6b5

下载说明

面向千万亿次计算的算法与应用PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第1章　千万亿次计算科学应用的性能特征1

1.1 介绍1

1.2　测试的各种体系结构2

1.3　科学应用概述4

1.4　GTC:Particle-in-Cell磁融解5

1.5　ELBM3D：晶格玻耳兹曼流体动力学9

1.6　Cactus：通用的相对天体物理学11

1.7　PARATEC：材料科学的第一原理14

1.8　HyperCLaw：双曲AMR气体动力学17

1.9　总结与结论20

1.10　致谢21

参考文献22

第2章千万亿次的计算对NASA未来使命的影响24

2.1 介绍24

2.2　Columbia超级计算机24

2.3　航空宇宙分析及计算25

2.3.1 方法论25

2.3.2 结果26

2.3.3　NASA使用千万亿次计算的好处27

2.4　推进子系统分析28

2.4.1 方法28

2.4.2 结果28

2.4.3 千万亿次计算给NASA带来的益处30

2.5　飓风预测30

2.5.1 方法31

2.5.2　结果32

2.5.3　千万亿计算对NASA的益处32

2.6　瓶颈33

2.7　总结34

参考文献34

第3章　多物理模拟与千万亿次计算36

3.1 引言36

3.2　下一代超级计算机36

3.3　适用于大规模并行机的编程模型37

3.3.1 新型并行语言38

3.3.2　MPI-238

3.3.3　协作式并行38

3.3.4　协作式并行的应用实例39

3.4　多尺度算法40

3.4.1 并行的多重网格方法40

3.4.2 ALE-AMR离散化41

3.4.3　离散-连续统混合算法42

3.5 目前及将来的应用43

3.5.1　万亿次仿真的技术现状43

3.5.2　通过协作并行进行多物理模拟45

3.6　未来展望46

3.7　致谢46

参考文献46

第4章　针对Uintah多物理程序代码的可扩展并行AMR算法研究48

4.1 前言48

4.2　自适应格网优化49

4.3　Uintah程序框架51

4.3.1 仿真组件52

4.3.2　负载均衡器52

4.3.3 调度器52

4.4　格网重构器53

4.5　提高性能55

4.6　将来的工作56

4.7　致谢57

参考文献57

第5章　使用Enzo对宇宙进化进行仿真59

5.1 宇宙结构的形成59

5.2　Enzo的编码60

5.2.1　物理层建模和数值算法60

5.2.2 自适应格网细化61

5.2.3 实现62

5.2.4　并行化63

5.2.5　快速的邻居格网搜索63

5.2.6　Enzo的I/O64

5.3　在万亿次平台上的性能和可扩展性65

5.3.1　单格网应用65

5.3.2　AMR应用65

5.3.3　并行扩展67

5.4　将Enzo运行在万亿次计算机平台上69

5.4.1　新的AMR数据结构69

5.4.2　混合型并行69

5.4.3　天体运动和宇宙射线之间的隐性关联70

5.4.4 内部数据关系分析工具70

5.5　致谢71

参考文献71

第6章　重大影响天气现象数值预测：千万亿次计算的重要动力73

6.1 引言73

6.2　计算方法和工具75

6.2.1 区域性天气预测模型75

6.2.2　千万亿系统中的内存和性能问题75

6.2.3　分布式内存并行和消息传递76

6.2.4　负载均衡78

6.2.5　时间消耗和可扩展性78

6.2.6　NWP系统中其他重要的组件79

6.2.7　其他问题80

6.3　NWP实际应用例子81

6.3.1　大规模的天气预报81

6.3.2　高分辨率的龙卷风仿真82

6.3.3　通过观测现象对龙卷风进行预测82

6.4　数值天气预报的挑战和需求83

6.5 总结84

6.6　致谢84

参考文献84

第7章千万亿次气象科学应用的软件设计87

7.1 介绍87

7.2　气象科学88

7.3　千万亿次计算机的体系结构88

7.4　区域气象系统模型CCSM（Community Climate System Model）90

7.4.1　当前CCSM概述90

7.4.2　区域大气模型CAM（Community Atmosphere Model）91

7.4.3　并行海洋程序POP（Parallel Ocean Program）93

7.4.4　区域陆地模型95

7.4.5　社区海洋冰川模型96

7.4.6　模型的耦合96

7.5 总结97

7.6　致谢98

参考文献98

第8章　迈向分布式千万亿次计算102

8.1 引言102

8.2　网格计算103

8.3　基于网格的千万亿次计算104

8.4　虚拟银河105

8.4.1　银河的多物理学模型106

8.4.2　银河仿真的性能模型108

8.4.3　千万亿次虚拟银河仿真109

8.5　讨论与总结110

参考文献111

第9章千万亿次计算时代的生物分子建模115

9.1 引言115

9.2　NAMD的设计116

9.2.1　混合分解116

9.2.2　动态负载平衡117

9.3　面对千万亿次的挑战与所需的改进117

9.3.1 目前的性能118

9.3.2　在未来千万亿次机器上的性能119

9.3.3 协处理器加速119

9.4　生物分子应用120

9.4.1 水通道蛋白120

9.4.2　钾通道121

9.4.3 病毒122

9.4.4　核糖体122

9.4.5　色素体122

9.4.6　BAR域囊泡123

9.5 总结123

9.6　致谢123

参考文献124

第10章　用于分子动力学模拟的千万亿次计算机126

10.1 介绍126

10.2　MDGRAPE-3的硬件127

10.3　MDGRAPE-3进行的计算128

10.4　MDGRAPE-3的芯片129

10.4.1　力计算流水线129

10.4.2　粒子j的内存和控制单元130

10.4.3　芯片说明132

10.5　系统结构133

10.6　MDGRAPE-3的软件135

10.7　MDGRAPE-3的性能138

10.8　总结和展望140

10.9　致谢141

参考文献141

第11章　在千万亿次超级计算机上进行生物分子仿真144

11.1 引言144

11.2　机遇146

11.2.1　研究更大生物分子系统的能力146

11.2.2　研究更长时间范围的能力147

11.2.3　混合量子与经典仿真149

11.2.4　更精确的仿真150

11.3　挑战150

11.3.1 在大于100K数量的处理器上扩大生物分子模拟代码的规模150

11.3.2　适应硬件的变化152

11.3.3　容错性154

11.3.4　包含可配置计算的多范型硬件154

11.3.5　千万亿次计算带来的新的仿真方法155

11.4　总结和展望155

11.5　致谢156

参考文献156

第12章　处理大规模图的多线程算法159

12.1 引言159

12.1.1 图运算中的问题160

12.1.2　分布式存储图运算的扩展局限性160

12.2　Cray MTA-2平台161

12.2.1　并行性表示161

12.2.2　对细粒度同步的支持162

12.3　案例分析：最短路径算法162

12.3.1　初步分析163

12.3.2　△-分步算法164

12.3.3　Thorup算法165

12.3.4　实验结果167

12.4　案例分析：连通分量170

12.4.1　传统PRAM算法171

12.4.2　Kahan的多层次算法171

12.4.3　性能比较171

12.5　结论172

12.6　致谢173

参考文献173

第13章千万亿次计算中的灾难恢复算法研究176

13.1　FT-MPI：一个实现容错功能的MPI177

13.1.1　FT-MPI概述177

13.1.2　FT-MPI：一个实现容错功能的MPI177

13.1.3　FT-MPI的使用178

13.2　应用级的无盘检查点技术178

13.2.1 基于邻居的检查点方案180

13.2.2　基于校验和的检查点方案181

13.2.3　基于加权校验和的检查点方案182

13.3　一种容错的递归方程求解器184

13.3.1　有条件的共轭梯度算法184

13.3.2　将容错机制添加到PCG算法中184

13.4　实验评估186

13.4.1 使用不同MPI实现的PCG算法的性能187

13.4.2　设置检查点的性能开销187

13.4.3 执行恢复操作的性能开销189

13.4.4　恢复操作中的舍入错误所带来的数值影响190

13.5　讨论190

13.6　结论和未来工作191

参考文献191

第14章　TSUBAME的研制与未来发展194

14.1　引言-2通向TSUBAME之路194

14.2　TSUBAME的架构需求195

14.3 TSUBAME一瞥198

14.4　TSUBAME之旅——使世人皆能超级计算的性能和操作202

14.5 结论和展望—TSUBAME 2.0205

参考文献207

第15章　通过SMP模块构造千万亿次的性能209

15.1 引言209

15.2　OpenMP编程体系结构211

15.3　通过OpenMP实现的循环级并行211

15.4　C＋＋与OpenMP212

15.4.1　迭代循环212

15.4.2　ccNUMA的关键问题213

15.4.3　并行化面向对象代码213

15.4.4　线程安全性214

15.5　应用OpenMP实现嵌套并行化214

15.5.1 目前OpenMP规范中的嵌套并行化214

15.5.2　FIRE的基于目录图像修复215

15.5.3　多块CFD数据集中3D关键点的计算215

15.5.4　TFS流体求解器217

15.6　结论与展望220

参考文献220

第16章千万亿次系统的性能及其复杂性分析223

16.1 引言223

16.2　千万亿次系统体系结构的发展趋势及其并发度223

16.3　性能特征和基准测试的现状224

16.3.1　基准测试创新225

16.3.2　应用程序的性能特征226

16.3.3　性能复杂性和性能效能的测量226

16.4 APEX-MAP226

16.4.1　APEX-Map的设计原则227

16.4.2 并行编程范式与APEX-MAP的对比227

16.5　性能复杂性特征描述228

16.5.1　性能复杂度定义229

16.5.2　性能模型选择&231

16.5.3　若干并行系统的性能复杂性分析232

16.6　小结234

参考文献235

第17章　高度可扩展的性能分析工具237

17.1 引言237

17.2　性能分析概念回顾238

17.3　Paradyn238

17.4 SCALASCA239

17.5　Vampir Next Generation240

17.6 Periscope240

17.6.1 体系结构240

17.6.2 ASL性能属性描述241

17.6.3 Periscope结点代理241

17.6.4 性能属性搜索243

17.6.5　Peirscope高层代理243

17.6.6　代理通信基础构造244

17.6.7　评价245

17.7　工具对比和未来研究247

参考文献248

第18章　面向千万亿次计算规模的多级有限元求解器251

18.1 引言251

18.1.1　概述251

18.1.2　千万亿次架构示例251

18.2　设计范例252

18.2.1　分层混合格网252

18.2.2　ParExPDE254

18.3　评估与比较256

18.4　结论259

参考文献260

第19章高效有限元代码开发的混合方法262

19.1　简介262

19.2　高级应用代码263

19.3　代码生成269

19.3.1　元编程269

19.3.2　变分问题的实时编译270

19.3.3 FFC271

19.3.4　SyFi273

19.4　有限元集成的统一框架276

19.4.1　有限元集成276

19.4.2　UFC接口276

19.4.3　实现UFC接口278

19.5 总结278

19.6　致谢279

参考文献279

第20章　使用Charm＋＋编写千万亿次应用程序283

20.1 动机283

20.2　Charm＋＋和AMPI：编程模型284

20.2.1　动态负载均衡285

20.2.2　投影285

20.2.3　其他特性概述286

20.3　Charm＋＋应用程序287

20.3.1　NAMD287

20.3.2　LeanCP288

20.3.3 ChaNGa290

20.3.4　其他应用291

20.4　大型系统仿真292

20.5　新型并行语言293

20.6　总结294

20.7　致谢294

参考文献294

第21章　基于注解的高产出率和性能移植性298

21.1 引言298

21.2　实现298

21.2.1 总体设计298

21.2.2　注解语法299

21.2.3　系统扩展300

21.2.4　代码生成模块300

21.3　性能研究306

21.3.1 STREAM基准测试306

21.3.2　AXPY操作307

21.4　相关工作308

21.4.1　自调节的库和代码308

21.4.2　编译器方法309

21.4.3　性能相关的用户注解310

21.5　总结与未来的方向310

21.6　致谢310

参考文献311

第22章　高效能编程语言的局部性感知特性313

22.1 引言313

22.2　Chapel中关于数据并行化的基本概念314

22.2.1　域314

22.2.2　数组316

22.3　数据分布316

22.3.1　基本方法316

22.3.2　“分布”接口317

22.3.3　局部存储对象上的分配策略319

22.4　实例与讨论319

22.4.1　一个负载平衡块分布319

22.4.2　一个稀疏数据分布321

22.5　实现324

22.5.1　编译器实现进展324

22.5.2　分布实现策略324

22.6　相关工作326

22.7　结论和未来展望326

22.8　致谢327

参考文献327

第23章　体系结构与程序设计方法对获得持续千万亿次计算性能的影响329

23.1　引言329

23.2　数值计算和计算机发展的历史简介329

23.2.1　20世纪60年代329

23.2.2　20世纪70年代330

23.2.3　20世纪80年代330

23.2.4　20世纪90年代330

23.2.5　2000年及以后331

23.3　体系结构331

23.3.1 处理器发展331

23.3.2　Cell Broad Engine处理器333

23.3.3 ClearSpeed卡333

23.3.4　类向量体系结构334

23.3.5　能耗和成本因素334

23.3.6　通信网络335

23.3.7　通信协议和并行范式335

23.4　超大型计算机的算法335

23.4.1　大规模计算机335

23.4.2　Linpack局限性336

23.4.3　选择算法实现方法338

23.5　其他技术的影响340

参考文献340

第24章　Cactus框架：从黑洞到伽玛射线脉冲342

24.1 相对天体物理学目前的挑战和伽玛射线脉冲问题342

24.2　Cactus框架344

24.3 时空代码和流体动力学代码345

24.3.1 Ccatie：时空进化345

24.3.2　Whisky：广义相对论流体动力学346

24.4　并行化的实现和格网细化346

24.4.1　PUGH347

24.4.2　使用Carpet实现自适应格网细化347

24.4.3 I/O348

24.5　当前机器的扩展性348

24.5.1　浮点性能349

24.5.2　I/O性能350

24.6　在千万亿次计算上的发展351

24.6.1　物理学：辐射传输352

24.6.2　扩展性352

24.6.3 工具353

24.7　致谢354

参考文献354