学位论文 > 优秀研究生学位论文题录展示
万亿次机群系统NPB性能评测与并行非数值算法实现及性能分析
作 者: 袁伟
导 师: 张云泉
学 校: 中国科学院研究生院(软件研究所)
专 业: 计算机软件与理论
关键词: 万亿次机群系统 性能评侧 NPB 并行数据挖掘 关联规则
分类号: TP338
类 型: 硕士论文
年 份: 2005年
下 载: 159次
引 用: 2次
阅 读: 论文下载
内容摘要
高性能计算正处于一个新的快速发展时期,有两个现象值得关注,一方面,并行计算机的峰值性能提升迅速,峰值计算速度高达百万亿次的计算机系统已经被研制成功,高性价比的机群(cluster)成为高性能计算机的主流架构,促进了高性能计算在更多领域的普及应用;另一方面,并行应用软件缺乏,高性能计算机的实际效率长期以来处于较低水平,当前大型并行应用软件仅能发挥20%以下的系统峰值性能。 应用性能才是用户最关心的,也是最重要的。并行软件和应用水平已经成为高性能计算发展中的薄弱环节,应该给予更多的重视。并行计算机和并行应用程序是影响并行计算性能的两个主要方面,也是本文的研究重点。 本文以3个万亿次机群系统为平台,利用有着很强应用背景的NPB(NAS Parallel Benchmarks)进行性能测试分析。NPB程序包的8个程序都来自于实际应用领域,是科学计算领域并行应用的典型代表,NPB性能评测属于面向应用的性能评测,可以较真实地表现出系统的拟应用性能。 通过NPB测试,重点研究在大规模并行处理时(处理器数目达到上千个)系统的性能特点和趋势。分析了不同的处理器、互连网络等系统配置对NPB性能的影响,发现NPB的8个程序在3个万亿次机群上的性能特点和表现并不一致,表明国产高性能机群在设计上正在逐渐走出同质化的趋势,向多样化发展。进一步分析表明,目前NPB程序的可扩展性可以达到几百个处理器,但尚不能达到上千个处理器,NPB程序能发挥出的系统峰值的百分比仍然徘徊在10%左右,机群系统的并行可扩展性和应用程序对机器运算潜能的利用还需要进一步提高。对于处理器数目达到上千个的万亿次机群系统来说,对聚合通信和细粒度通信能力的支持亟需提高。 高性能并行计算在非数值领域有着广泛的应用前景。本文介绍了一个自主开发的基于MPI的并行数据挖掘系统(关联规则挖掘),在2个机群系统上进行了加速比性能测试,分析了程序的并行特点。结果表明,在非数值并行应用中,应当做好数据划分,精心设计优化数据结构,尽可能利用程序与易并行程序相类似的特点,这样可以有效减少进程间通信,实现负载均衡和同步计算,使得程序有较好的并行性能。
|
全文目录
目录 7-9 引言 9-11 第一章 绪论 11-25 1.1 研究背景 11-18 1.1.1 高性能计算简介 11-12 1.1.2 高性能并行计算机与机群系统 12-16 1.1.3 并行编程模型 16-17 1.1.4 高性能计算应用现状 17-18 1.2 高性能并行计算机性能评测 18-24 1.2.1 性能评测的意义 18-19 1.2.2 高性能并行计算机主要性能参数 19 1.2.3 基准程序介绍 19-22 1.2.4 高效能计算系统及其测试 22-24 1.3 本章小节 24-25 第二章 测试环境 25-33 2.1 曙光4000A 25-28 2.1.1 简介 25-26 2.1.2 硬件系统 26 2.1.3 软件系统 26 2.1.4 Opteron64位计算介绍 26-28 2.2 深腾6800超级机群系统 28-30 2.2.1 简介 28 2.2.2 硬件系统 28 2.2.3 软件系统 28 2.2.4 Itanium64位计算介绍 28-30 2.3 国家973LSSC-Ⅱ万亿次机群系统(深腾1800) 30-31 2.3.1 简介 30 2.3.2 硬件系统 30-31 2.3.3 软件系统 31 2.4 本章小节 31-33 第三章 机群系统NPB性能测试分析 33-49 3.1 NPB简介 33-35 3.2 NPB测试方法 35-36 3.3 机群系统性能对比测试分析 36-41 3.3.1 影响机群性能的两个主要因素 36-38 3.3.2 Deepcomp6800与Deepcomp1800T性能测试比较 38-39 3.3.3 Dawning4000A与Deepcomp6800性能测试比较 39-41 3.4 系统效率测试分析 41-43 3.5 可扩展性测试分析 43-47 3.6 本章小节及相关工作介绍 47-49 第四章 关联规则并行挖掘程序实现与性能分析 49-65 4.1 基于关联规则的并行数据挖掘 49-55 4.1.1 数据挖掘及关联规则挖掘 49-51 4.1.2 关联规则挖掘串行算法 51-53 4.1.3 关联规则挖掘并行算法 53-55 4.2 基于MPI的关联规则并行挖掘程序设计与实现 55-59 4.2.1 MPI简介 55-57 4.2.2 程序设计与实现中的关键问题 57-59 4.3 加速比测试及性能分析 59-64 4.3.1 性能测试 59-62 4.3.2 性能分析 62-64 4.4 本章小节 64-65 第五章 结论及未来工作 65-67 参考文献 67-73 硕士期间发表文章目录 73-75 致谢 75
|
相似论文
- 基于数据挖掘的税务稽查选案研究,F812.42
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 数据挖掘在学校管理和学生培养中的应用,TP311.13
- 基于关联规则的结构化浏览技术及其应用,TP391.41
- 数据挖掘技术在独立学院教学评估中的应用研究,TP311.13
- 通信行为指纹研究,TP311.13
- 动态关联规则的研究,TP311.13
- 高速网络环境下的入侵检测系统的研究,TP393.08
- 基于日志分析的超级计算机错误预测方法研究,TP338
- 数据挖掘在学生评价系统中的应用,TP311.13
- 面向隐私保护的关联规则挖掘研究,TP311.13
- 用户交易行为的分析与展示—在现代易货业中的应用,TP311.13
- 基于关联规则和图排序的句子情感倾向性研究,TP391.1
- 基于数据挖掘的入侵检测技术的研究,TP393.08
- 关联规则算法及其在智能药房系统中的应用研究,TP311.13
- 基于数据仓库的新农合管理系统研究,TP311.13
- 基于关联规则的地铁基坑工程施工风险监测研究,U231.3
- 基于聚类分析和关联规则的痹证医案处方用药规律研究,R255.6
- 再生障碍性贫血中医证候分型文献的数据挖掘研究,R259
- 基于Web使用挖掘的网站优化研究,TP393.092
- 基于关联规则的入侵检测系统设计与实现,TP393.08
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机
© 2012 www.xueweilunwen.com
|