学位论文 > 优秀研究生学位论文题录展示
机群高效通讯系统的研究与实践
作 者: 孟丹
导 师: 李国杰
学 校: 中国科学院研究生院(计算技术研究所)
专 业: 计算机组织与系统结构
关键词: 机群 机间通讯 系统域网 传统网络接口 智能网络接口 真正零拷贝 用户级通讯 流量控制
分类号: TP338
类 型: 博士论文
年 份: 1998年
下 载: 84次
引 用: 0次
阅 读: 论文下载
内容摘要
随着近年来商用微处理器性能的迅速提高,机群系统变得越发引人注目。人们预期,由于在可扩展性和性能价格比等方面存在的优势,机群系统将成为高性能服务器领域的一种主流平台。由于机间通讯是制约机群系统性能的一个关键,因此成为机群研究中的热点。本文结合国家“863”重点项目曙光2000高性能计算机的研制对机群系统中高效机间通讯系统进行了深入的研究,提出了一种全新的消息分类方法和基于这种分类方法的软件通讯协议,同时设计了一种綦于盈余(credit)的动态流量控制算法和相应的死锁防止方法,解决了通讯软件的可扩展性问题。在性能分析的基础上本文对影响机间通讯性能的主要因素做了分析并对通讯系统的两种主要结构进行了比较。 本文的工作主要包括以下几个方面: 1.对与机群机间通讯系统相关的问题进行了深入、细致地研究,尤其是对系统域网的概念和特征进行了探讨,同时在对当今世界上有代表性系统进行分析比较的基础上提出了机群机间通讯系统设计实现中面临的一些关键问题和已有的解决策略。 2.提出了一种全新的消息分类方法和相应的软件通讯协议。目前已有的消息分类方法只是依据PIO和DMA在传输数据时性能的差异而简单地将消息分为长短两类。在此基础上,新的分类方法还将内存拷贝、进出操作系统核心以及虚实地址转换等开销以及流量控制的需求考虑在内。依据新的分类方法,消息被分作四类,并采用不同的协议进行传送。在此分类方法和软件通讯协议基础上实现的底层通讯库API消除了对其用户数据缓冲区的任何限制,理想情况下可实现数据在由用户发送缓冲区到接收缓冲区间传输过程中真正意义上的零拷贝。 3.设计出一种基于盈余的动态流量控制算法和相应的死锁防止方法。这种流量控制算法克服了传统的基于盈余的流量控制算法在可扩展性方面的缺陷,同时也避免了由发送方预留缓冲区所可能造成的数据包在网络上做无谓的传递和用于对无序数据包进行接收的开销。使用新的算法,消息接收方为所有可能的发送方所预留的缓冲区大小不会随应用规模的扩大而呈线性增长。 4.介绍了曙光2000机间通讯软件在采用传统网络接口和智能网络接口两种不同的通讯系统结构中的实现策略。通过对在传统网络接口上实现的底层通讯软件性能的分析和对在智能网络接口上实现的底层通讯软件性能的估算,本文对这两种结构进行了比较并试图阐明它们各自的优缺点。
|
全文目录
第一章 绪论 6-14 1.1 机群系统的组成与结构特征 6-8 1.2 机群系统与其它主流高性能计算系统的比较 8-9 1.3 机群系统的优点及其发展前景 9-10 1.4 高效机间通讯在机群系统中的重要地位 10-12 1.5 主要工作与内容安排 12-13 参考文献 13-14 第二章 高效机间通讯系统的基本概念和评价方法 14-25 2.1 高效机间通讯系统的组成与结构 14-15 2.2 机间通讯系统的特征 15-17 2.3 系统域网 17-20 2.3.1 系统域网的概念 17-18 2.3.2 系统域网特征 18-20 2.4 机群高效通讯系统的评价 20-23 2.4.1 通讯开销对并行处理性能的影响 20 2.4.2 LogP模型和LogGP模型对通讯开销的描述 20-22 2.4.3 机群高效通讯系统的评价方法 22-23 参考文献 23-25 第三章 高效机间通信系统的主流技术与关键问题 25-50 3.1 代表性高效机间通信系统研究 25-33 3.1.1 VMMC 25-27 3.1.2 U-Net 27-29 3.1.3 Active Message 29-30 3.1.4 Fast Sockets 30-31 3.1.5 SP2 MPL 31-32 3.1.6 对上述通信系统的评价 32-33 3.1.7 本节小结 33 3.2 机群高效通信系统设计和实现中的主流技术 33-36 3.2.1 采用新的通信机制 33-34 3.2.2 实现用户级通信 34-35 3.2.3 减少内存拷贝 35-36 3.2.4 增强网络接口功能 36 3.2.5 本节小结 36 3.3 机群高效通信系统设计实现中的关键问题研究 36-47 3.3.1 影响机群高效通信系统设计实现和性能的主要因素 36-38 3.3.2 机群高效通信系统设计实现中的关键问题及其解决策略 38-47 3.3.3 本节小结 47 参考文献 47-50 第四章 曙光-2000及其机间通信系统的实现策略 50-56 4.1 曙光-2000硬件结构与基本配置 50-51 4.2 曙光-2000系统软件构成及其层次结构 51-52 4.3 曙光-2000高效通信系统的两种实现策略 52-55 参考文献 55-56 第五章 基于传统NI的BCL实现策略 56-82 5.1 指导思想和关键技术 56 5.2 通信系统的总体结构 56-58 5.3 BCL-1的设计与实现 58-64 5.4 BCL-1设计中重要问题的讨论 64-65 5.5 流量控制与死锁防止 65-72 5.5.1 动态流量控制算法及其死锁防止 66-72 5.5.2 算法分析与比较 72 5.6 BCL-1的性能分析 72-80 参考文献 80-82 第六章 基于智能NI的BCL实现策略 82-98 6.1 前言 82 6.2 通信系统的总体结构 82-85 6.3 BCL-2的设计目标、指导思想和关键技术 85-86 6.4 BCL-2的设计与实现 86-94 6.5 BCL-2设计中的主要约束与性能瓶颈 94-95 6.6 BCL-2的评价 95 参考文献 95-98 致谢 98-99 博士后期间发表论文情况: 99 博士后期间受资助情况: 99
|
相似论文
- IP网络QoS技术研究,TP393.09
- 基于Linux的流量控制系统的研究与实现,TP393.06
- 无线局域网帧流量控制、预测及能量效率研究,TN925.93
- 动态流量管理系统的设计与实现,TP393.06
- FCIP跨层流量控制的设计与实现,TP393.06
- MPLS网络队列参数优化设计研究,TP393.06
- 校园网服务平台与安全管理系统设计与实现,TP393.18
- EMS型高速磁浮列车悬浮导向系统远程监控技术研究,TP277
- 电子政务专网的优化研究与实现,TP399-C2
- 10G-NP芯片高速接口的设计与实现,TN402
- 海上油田井下实时测控分采工艺技术研究,TE355.22
- 恒流量控制阀的设计及系列化研究,TH137.52
- 多网网关的高速串行接口与流量控制技术研究,TP393.05
- 平台网络系统架构的研究与设计,TP393.18
- 商业银行中间业务平台的研究与应用,TP311.52
- 流量控制和服务器选择的联合优化研究及实现,TN919.8
- 通信网络的可靠数据传输控制策略研究与实现,TN915.02
- 舰载机拦阻系统的动力学仿真分析,V271.492
- 气流式微富集系统研究与设计,TP273.5
- 基于SSL VPN的远程访问控制平台研究,TP393.08
- 网络流量控制及流量分析,TP393.06
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机
© 2012 www.xueweilunwen.com
|