学位论文 > 优秀研究生学位论文题录展示
面向CFD的交互式并行化技术研究
作 者: 丁晓宁
导 师: 朱怡安
学 校: 西北工业大学
专 业: 计算机应用
关键词: 并行处理 自动并行化 计算流体力学 交互式 相关分析 区域计算模型 区域相关 通信令牌 对象树
分类号: TP311.52
类 型: 博士论文
年 份: 2002年
下 载: 239次
引 用: 0次
阅 读: 论文下载
内容摘要
程序自动并行化技术一直是并行处理领域的研究热点与难点,目前虽然已取得了长足进步,但实际应用效果还不理想。我们以计算流体力学CFD为应用领域对程序自动并行化技术进行了长期研究,针对银河-Ⅲ巨型机开发的程序自动并行化系统NPUPAR取得了较好的应用效果。在此基础上,国防科技大学并行与分布处理国家重点实验室建议我们扩充交互功能,进一步提高并行效率。本论文就是围绕国防重点实验室基金项目《面向计算流体力学的交互式并行化技术研究》(编号99JS94.6.1.HK0313)展开的。 本文的主要工作和贡献如下: 1、提出并建立了CFD程序并行化的区域计算模型。同传统的程序模型以及CFD程序的帧迭代模型和场循环模型相比,区域计算模型能够更好地反映CFD程序的结构特点,使得对CFD程序的深入分析成为可能。不但有利于保证并行程序正确性,而且有利于开发并行性,减少通信与同步,提高并行程序效率。 2、在传统相关性理论的基础上提出了区域相关(包括与循环无关的区域相关和跨循环的区域相关)的概念,研究了区域相关的测试算法。区域相关以区域操作为基本单位。区域操作本身所具有的对大块数据进行整体操作的特点,使得区域相关非常适合开发CFD程序中蕴含的数据并行性;同时,区域操作本身的灵活性又使自动并行化系统不但可以在全局范围内进行整体分析,而且可以深入到帧迭代和场循环内部进行较为细致地分析,进而生成更高质量的并行程序。 3、[Wolfe96]提出了使用FUD链识别分析递归变量的方法。本论文在区域和区域相关概念的基础上根据CFD程序的特点对FUD链予以扩充,提出了识别分析归约和归约变量的EFUD方法。使用EFUD方法不但可以识别复杂的标量归约,而且可以识别数组归约。 4、研究了基于区域相关的通信判定方法,给出了判定通信的条件以及确定通信数据范围(通信区域)的公式,并以此为基础提出了基于通信令牌的优化策略。通信令牌是包含通信区域、通信的方向等信息的多元组。使用通信令牌便于通过交互进行手工优化。基于通信令牌的优化策略通过合并通信令牌降低通信量,减少通信的次数;通过寻找通信令牌最多的语句对象确定通信语句的位置以降低同步次数。摘要 5、为了提高系统交互效率,提出了程序对象树结构。使用程序对象树结构组织并行化系统的内部数据和程序代码,便于交互时信息的定位与综合,并且有利于实现增量分析。 本论文成功地实现了交互式并行化系统Paractive。经国防科技大学并行与分布处理国家重点实验室提供的CFD实际算例测试,Paractive生成的并行程序在银河-Ill并行计算机上4机并行效率达到80%,8机并行效率达到70%。q
|
全文目录
中文摘要 4-6 英文摘要 6-10 第一章 绪论 10-17 1.1 并行化技术的研究现状 11-13 1.2 本论文的研究背景 13-14 1.3 论文研究内容和创新点 14-15 1.4 论文结构 15-17 第二章 CFD程序的自动并行化技术 17-29 2.1 CFD的计算原理与计算模式 17-19 2.2 自动并行化技术的理论基础 19-22 2.2.1 数据相关和控制相关 19-20 2.2.2 循环中的相关关系 20-22 2.3 面向CFD的自动并行化技术 22-27 2.3.1 CFD程序的帧迭代模型、帧间相关以及帧同步与帧通信策略 22-24 2.3.2 CFD程序的场循环模型、场循环相关和二级同步的并行化模型 24-27 2.4 小结 27-29 第三章 CFD程序的区域计算模型 29-45 3.1 区域计算模型的基本思想 29-32 3.2 CFD串行程序的区域计算模型 32-41 3.2.1 数据模型 32-35 3.2.2 程序模型 35-41 3.3 区域计算模型对CFD串行程序的约束 41-42 3.4 区域计算模型与现有模型的关系 42-43 3.5 小结 43-45 第四章 区域分析技术研究 45-63 4.1 区域相关及其物理意义 45-47 4.2 CFD串行程序的区域分析技术 47-58 4.2.1 区域分析算法 48-51 4.2.2 区域相关测试 51-58 4.3 归约的识别与分析 58-62 4.4 小结 62-63 第五章 通信的判定和优化 63-76 5.1 基本原理 63-65 5.2 基于区域相关的通信判定 65-70 5.2.1 通信条件的确定 67-68 5.2.2 确定通信的内容 68-70 5.3 基于通信令牌的通信优化策略 70-72 5.3.1 通信项和通信令牌 70-71 5.3.2 基于通信令牌的通信优化算法 71-72 5.4 与归约变量有关的通信 72-74 5.5 小结 74-76 第六章 面向CFD的交互式并行化 76-86 6.1 交互式并行化系统与自动并行化系统 76-77 6.2 面向CFD的交互式并行化流程 77-79 6.3 程序对象树结构与增量分析 79-82 6.3.1 程序对象树 79-81 6.3.2 增量分析 81-82 6.4 静态性能预测 82-83 6.5 交互式并行化系统PARACTIVE整体结构 83-85 6.6 小结 85-86 第七章 性能测试 86-90 7.1 在机群系统上的测试结果及与原有系统的比较 86-88 7.1.1 程序mac.f的测试结果 86-87 7.1.2 程序slip2的测试结果 87-88 7.2 在银河-Ⅲ并行计算机上的测试结果 88-89 7.3 小结 89-90 第八章 结束语 90-92 致谢 92-94 参考文献 94-100
|
相似论文
- 基于XML的异构数据交换技术研究,TP311.13
- 嵌入式图形界面自动生成技术研究,TP311.52
- 面向对象数据库模型、存储及查询优化的研究,TP311.13
- 基于XML的异构数据库集成研究,TP311.13
- 基于有线电视网络窄带回传技术的研究与设计,TN943.6
- 互联电网区域间低频功率振荡特性研究,TM712
- 烤烟不同香型烟叶质量特点及判别分析,S572
- 陆地棉矮化突变体Ari1327的形态、生理和分子标记研究,S562
- 烤烟连作对土壤理化特性及烟叶品质的影响,S572
- H公司人才流失原因分析与对策研究,F272.92
- 国内冶金行业继续教育现状的调查与统计分析,F426.32
- 基于DCCA和MF-DCCA的步态信号的分析与研究,TN911.6
- 河北省大中型工业企业科技资源配置效率分析,F224;F425
- 浙江上市公司并购绩效与国际竞争力变化研究,F224
- 农村师资与基础教育质量关系研究,G525.1
- 基于静息态fMRI的癫痫病生机制基础研究,R742.1
- 大学生学业压力源与睡眠质量的特点及其关系,B841
- 印楝叶遗传多样性、化学分析及抗菌活性的相关性研究,R93
- 甜瓜数量性状遗传的研究及新品种的选育,S652
- 基于高分辨率遥感影像的滑坡灾害危险性评价研究,P642.22
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com
|