学位论文 > 优秀研究生学位论文题录展示
基于Linux的小型高性能集群的研究和优化
作 者: 李铮
导 师: 薛质
学 校: 上海交通大学
专 业: 通信与信息系统
关键词: Linux 高性能计算 MPI 矩阵相乘 HPL
分类号: TP316.81
类 型: 硕士论文
年 份: 2012年
下 载: 130次
引 用: 1次
阅 读: 论文下载
内容摘要
商业和科学研究的各个领域对计算能力的需求正在不断增长。传统的基于向量处理器和SMP的高性能计算机由于难以扩展、价格昂贵等原因始终局限在科学研究等专业领域。Linux系统和网络技术的发展为集群技术的发展提供了很好的条件。基于Linux的高性能集群具有良好的可扩展性,兼容性以及很高的性价比,使得其不仅在专业领域,也在小型高性能计算机的应用领域里成为了最为重要的研究对象本文构建的基于Linux的高性能集群包括管理节点、计算节点、网络互联设备、NFS文件共享系统、MPI并行编程库、BLAS线性函数库等多个软硬件模块。在上述的高性能集群的平台下,用C+MPI编程的形式实现了矩阵的并行乘法运算。矩阵相乘运算是在科学工程计算领域调用最多的运算之一,对矩阵相乘的实现具有测试和应用的双重意义。通过不同规模、不同处理器数量下,比较程序的运算时间验证了基于Linux高性能集群的并行性。HPL是验证高性能计算机性能最通用的Benchmark,也是高性能计算机TOP500的比较标准。它通过求解线性稠密方程组的运算测得高性能计算机的浮点运算能力。对HPL的优化是优化高性能计算机性能的一个重要课题。由于集群系统的复杂性,而且HPL提供很多参数供使用者调试,并没有一种通用的平台无关的调试方法。以往的优化一般是基于经验的穷举法,耗时很长而且很难涵盖所有的参数组合。本文通过提出一种基于参数影响因子排序的优化方案,寻找HPL参数调优的最佳路径。通过该方法对8节点、32核心、主频为2.67GHz的高性能平台进行优化,获得66%的效率。
|
全文目录
摘要 5-6 ABSTRACT 6-10 第一章 绪论 10-20 1.1 高性能计算机的需求和应用 10-11 1.2 高性能计算机的不同架构 11-16 1.2.1 向量计算器 11-12 1.2.2 对称多处理器 12-13 1.2.3 集群 13-16 1.3 不同的集群解决方案介绍 16-17 1.4 国内外的研究现状 17-18 1.5 本文的方案提出 18-19 1.6 本文的组织结构 19-20 第二章 并行算法理论基础 20-26 2.1 并行算法分类 20-21 2.2 并行化步骤 21-23 2.3 并行算法性能指标 23-25 2.3.1 执行时间 23 2.3.2 加速比 23-25 2.3.3 并行系统效率 25 2.4 本章小结 25-26 第三章 集群构建方案 26-37 3.1 集群构建拓扑结构 26-27 3.2 硬件模块 27-28 3.2.1 计算节点 27 3.2.2 管理节点 27 3.2.3 网络设备 27-28 3.3 软件模块 28-36 3.3.1 操作系统 28-29 3.3.2 节点间通信 29 3.3.3 文件共享方案 29-31 3.3.4 并行编程环境 31-34 3.3.5 线性数学函数库BLAS 34-36 3.4 本章小结 36-37 第四章 矩阵乘法的在高性能平台下的实现 37-51 4.1 矩阵乘法算法分析 37-40 4.1.1 矩阵相乘的串行算法 37-38 4.1.2 矩阵相乘的并行算法 38-40 4.2 Cannon 算法介绍 40-44 4.3 Cannon 乘法的并行算法描述 44-47 4.4 程序结果分析 47-49 4.5 本章小结 49-51 第五章 HPL 在集群上的运行和性能优化 51-65 5.1 HPL 介绍 51-52 5.2 求解稠密线性方程组的LU 分解法 52-55 5.2.1 高斯消元法 52-54 5.2.2 LU 分解算法 54-55 5.3 HPL 的计算过程 55-56 5.4 HPL 的运行环境和执行过程 56-58 5.5 集群性能优化 58-63 5.5.1 集群优化的方向 58 5.5.2 基于参数优先级排序的优化方式 58-63 5.6 本章小结 63-65 第六章 结束语 65-66 6.1 主要工作与创新点 65 6.2 后续研究工作 65-66 参考文献 66-69 致谢 69-70 攻读硕士学位期间已发表或录用的论文 70
|
相似论文
- 基于ARM的TFT-LCD面板检测设备软件的研究,TN873.93
- 网位仪信号采集与处理平台的设计与实现,S951.2
- 基于TCP/IP协议的嵌入式图像传输系统接收终端的设计,TP368.1
- 基于嵌入式系统钻孔成像装置的研究,P634.3
- IP网络QoS技术研究,TP393.09
- 一种基于i.MX51的嵌入式VoIP终端的设计与实现,TN916.2
- 基于MPI的三维地层建模和可视化方法研究,TP391.41
- 基于嵌入式Web技术的动态应变仪研究与实现,TP368.1
- 嵌入式通信管理装置的设计与研究,TP368.1
- 基于CPCI的多同步数字转接系统的设计,TN914.3
- GPON网络管理系统关键技术的研究和实现,TN929.1
- 基于嵌入式Linux的车辆轨迹复现手持终端的研究与实现,U495
- 嵌入式视频监控系统中的GUI设计与实现,TP277
- 环境一号卫星CCD影像云去除方法研究及并行化实现,P228
- 基于并行计算的医学超声成像技术研究,TP391.41
- 基于PC104嵌入式车道控制器的研发,TP273.5
- 一种基于ARM-LINUX和SQLITE的组件化嵌入式软件系统设计,TP311.52
- 嵌入式多参数环境智能监测系统的设计与实现,TP274
- 数字型智能终端系统门口机的设计,TP368.1
- 基于嵌入式系统的水厂加氯智能控制系统,TU991.2
- 基于嵌入式Linux的GPRS远程监控系统研究,TN929.5
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 操作系统 > 网络操作系统 > UNIX操作系统
© 2012 www.xueweilunwen.com
|