学位论文 > 优秀研究生学位论文题录展示
面向多核SMP集群的并行性能模拟技术研究
作 者: 翁玉芬
导 师: 王正华
学 校: 国防科学技术大学
专 业: 计算机科学与技术
关键词: 多核SMP 并行性能模拟 模拟精度 POSE 网络模拟
分类号: TP338.6
类 型: 硕士论文
年 份: 2009年
下 载: 73次
引 用: 0次
阅 读: 论文下载
内容摘要
随着多核技术的发展,出现了新型的多核SMP集群系统。它具有较好的灵活性和扩展性,结点内性能的提高带来整个多核SMP集群系统性能的提升,人们能够以相对更高的性价比拥有更多的计算核心。MPI消息传递并行应用在多核SMP集群系统上也表现出与传统单核处理器集群系统不同的性能特征,给性能分析与优化带来新的问题。同时,多核SMP集群系统可能扩展到上万个处理器,其性能模拟对宿主机本身性能要求较高。并行模拟器能够利用宿主机较大的内存容量和极大地并行化模拟任务使得模拟速度大大提高,因此采用并行性能模拟方法对多核SMP集群进行性能模拟。本文以如何准确模拟多核SMP集群系统性能为目标,对MPI消息传递并行应用在多核SMP集群上的性能预测展开了相关研究,主要工作如下:(1)MPI并行应用在多核SMP集群中的通信主要包括结点间通信、片间通信、片内通信这三层通信。由于通信的延迟、带宽在不同层中表现出很大差别,因此需要对每层通信进行模拟进而准确预测通信时间。基于延迟带宽的方法,根据消息大小、消息所处的层次、不同层的延迟带宽设定延迟计算公式,从而评估消息通信时间。在模拟运行时,首先判断消息所处的通信层次;其次执行消息所产生的事件以推进模拟时钟,并根据延迟计算公式计算各次通信时间,进而得到消息传递目标并行应用的执行时间。实验结果表明,对于通信量较小、网络资源竞争较低的并行应用,三层通信特点的延迟带宽模型模拟具有较高的模拟精度,且高于没有区分结点内通信层次的模型的模拟精度。(2)多核SMP集群由于资源共享引起通信竞争,主要包括对结点内的核间二级缓存、内存和网络中交换机端口的竞争。针对通信中存在的竞争,对多核SMP超结点和两种主流高性能集群互连网络(交换式以太网和InfiniBand网络)进行详细的性能建模。该详细模型主要对交换机、网卡、结点、内存及二级缓存进行建模,实现了交换机制、网络拓扑、路由策略、通道选择策略及流控制策略,同时也通过在交换机端口维持一个负载模型和竞争模型实现了自适应路由,从而精确刻画通信竞争并准确预测通信时间。实验结果表明,对于通信量较大、网络资源竞争较高的并行应用,详细模型模拟也具有较高的模拟精度,且高于延迟带宽模型的模拟精度。
|
全文目录
摘要 9-10 ABSTRACT 10-12 第一章 绪论 12-22 1.1 研究背景 12-13 1.2 研究现状 13-19 1.2.1 并行系统性能模拟技术 13-18 1.2.2 互连网络性能模拟技术 18-19 1.3 研究内容与研究贡献 19-21 1.4 论文结构 21-22 第二章 相关背景技术 22-35 2.1 引言 22-23 2.2 并行系统并行性能模拟技术 23-27 2.2.1 并行离散事件性能模拟技术概述 24-25 2.2.2 并行离散事件性能模拟中的建模技术 25 2.2.3 基于并行离散事件的互连网络性能模拟技术 25-27 2.3 典型并行离散事件性能模拟环境POSE 27-34 2.3.1 概述 27-30 2.3.2 POSE中的面向对象建模技术 30-32 2.3.3 基于POSE的BigSim并行性能模拟器 32-34 2.4 本章小结 34-35 第三章 基于延迟带宽模型的多核SMP集群性能模拟 35-45 3.1 引言 35-36 3.2 基于延迟带宽的性能建模 36-38 3.2.1 功能模型与仿真 36-37 3.2.2 性能模型 37-38 3.3 实现 38-41 3.4 实验与分析 41-44 3.5 本章小结 44-45 第四章 基于详细网络模型的多核SMP集群性能模拟 45-63 4.1 引言 45 4.2 多核SMP集群拓扑模型 45-46 4.3 多核SMP结点建模 46-47 4.3.1 二级缓存模型 46 4.3.2 内存模型 46-47 4.3.3 结点模型 47 4.4 集群网络建模 47-53 4.4.1 交换式以太网建模 47-50 4.4.2 InfiniBand网络建模 50-53 4.5 实现 53-57 4.6 实验与分析 57-62 4.6.1 基于交换式以太网的集群的模拟结果 57-59 4.6.2 基于InfiniBand的集群的模拟结果 59-61 4.6.3 结果分析 61-62 4.7 本章小结 62-63 第五章 结束语 63-65 5.1 研究工作总结 63-64 5.2 进一步研究展望 64-65 致谢 65-67 参考文献 67-72 作者在学期间取得的学术成果 72-73 作者在学期间参加的主要科研工作 73
|
相似论文
- 基于多核SMP集群环境的光线追踪模拟卫星成像并行研究与实现,TP391.41
- Trace驱动并行模拟中的性能优化技术研究,TP338.6
- 等离子弧表面淬火过程的温度场数值模拟,TG156.3
- 汽车典型覆盖件曲面重构及精度提高,U466
- 关于岩体结构网络模拟的计算机辅助研究,TD313
- 常减压装置过程模拟与换热网络优化,TE624
- 风险投资项目的风险分析方法研究,F832.48
- 网络模拟器NS2性能提高方法的研究,TP393.02
- 网络模拟中的数据包—流混合模拟研究,TP393.01
- 节理岩体等效本构关系研究及工程应用,TU452
- 高性能网络安全事件模拟技术研究,TP393.08
- 大规模网络模拟中拓扑折叠技术的研究,TP393.02
- 电容层析成像并行图像重建机制的研究,TP391.41
- 网络模拟中背景流量模型的研究,TP18
- 并行网络模拟TCL脚本自动生成系统的设计与实现,TP311.52
- 大规模域间路由测试模拟系统研究与实现,TP393.02
- 并行网络模拟中面向安全事件的拓扑划分技术研究,TP393.08
- 网络模拟中本地路由策略的研究与优化,TP393.02
- 大规模并行网络模拟中高性能远程路由策略的研究,TP393.02
- 黄岛地下水封洞库裂隙岩体渗透性研究,P641
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机 > 并行计算机
© 2012 www.xueweilunwen.com
|