学位论文 > 优秀研究生学位论文题录展示

大规模并行计算系统软件低功耗关键技术研究

作 者: 董勇
导 师: 杨学军
学 校: 国防科学技术大学
专 业: 计算机科学与技术
关键词: 大规模并行计算系统 功耗优化 OpenMP循环调度 互连网络静态能量优化 网络拓扑图划分 路由器独立占用
分类号: TP302.7
类 型: 博士论文
年 份: 2012年
下 载: 44次
引 用: 0次
阅 读: 论文下载
 

内容摘要


功耗已经成为大规模并行计算系统性能提升的重要约束条件之一。过高的功耗和能量消耗对系统的运行产生多种负面影响,包括系统故障率提高、可靠性降低、运行成本增加等。对大规模并行计算系统进行功耗优化研究具有重要的现实意义。大规模并行计算系统的功耗优化已经在系统设计与实现的各个层面展开,包括电路设计、逻辑设计、体系结构以及系统软件和应用软件层等。硬件设备的动态电压调节(DVS)和部件关闭等技术为软件功耗优化奠定了实现基础。软件低功耗优化具有不依赖于硬件平台、更灵活、可移植性好等诸多优点。计算系统,通信系统是大规模并行计算系统的核心,也是大规模并行计算系统功耗优化的重点。本文针对大规模并行计算系统的软件功耗优化技术,对基于循环调度的结点机能量优化、基于网络拓扑图划分的互连网络能量优化展开了研究。针对结点机的能量优化是大规模并行计算系统能量优化的重要组成部分。本文研究了基于OpenMP循环调度的结点机能量优化技术,通过将DVS和调度算法相结合提出了两类功耗优化算法:性能受限的能量优化和能量受限的性能优化。性能受限的能量优化通过对块轮循静态调度算法进行改进,提出了能量节约的最优静态调度算法(EOSS)。进一步考虑cache失效对访存延迟的影响,提出了改进的最优静态调度算法(IEOSS)。能量受限的性能优化在有限能量供给条件下,通过循环调度,减少循环执行时间,提出了能量受限的性能最优静态调度算法(ECPOSS)。论文证明了EOSS和ECPOSS的最优性,并通过实验验证了上述算法的有效性。互连网络能量优化对全系统能量优化具有重要意义。静态能耗是大规模并行计算系统互连网络能量消耗的主要组成部分。网络部件关闭是有效降低互连网络静态能耗的重要技术。本文提出了基于网络拓扑图划分的互连网络能量优化。首先分析了空间、时间两维路由器的占用性,提出了基于路由规则的网络拓扑图划分的概念,提出了Nd-mesh、Nd-torus、胖树的确定性路由、方向自适应路由和完全自适应路由规则的拓扑图划分方法,以此为基础提出了基于网络拓扑图划分的静态能量管理实现关键技术,在空间、时间两个维度上实现了空闲路由器关闭。基于TH-1A的软件系统框架提出并实现了基于网络拓扑图划分的互连网络静态能量管理技术方案,构建了虚实结合的验证环境,并通过大量实验结果验证了所提出方法的有效性。本文的主要创新点如下:1.提出了能量优化指导的并行循环调度方法。从性能受限能量优化和能量受限性能优化两个角度出发,给出了两类OpenMP循环调度能量优化算法,分别以能量节约的最优静态调度算法(EOSS)和能量受限的性能最优静态调度算法(ECPOSS)为代表。证明了EOSS和ECPOSS的最优性,并通过实验评测验证了这两类算法的有效性。2.提出了基于网络拓扑图划分的路由器关闭思想。从空间维度分析了作业对路由器的直接占用和间接占用,从时间维度分析了作业对路由器的连续占用。在此基础上分析了多作业对路由器的独立占用,从而提出了网络拓扑图划分的概念,以指导路由器关闭。3.提出了典型网络、典型路由规则的网络拓扑图划分方法。给出了Nd-mesh、Nd-torus、胖树的确定性路由、方向自适应路由、完全自适应路由规则支配下的网络拓扑图划分定理和算法。4.提出了基于网络拓扑图划分的静态能量管理实现的关键技术,包括不可关闭域设置技术、拓扑感知的资源分配策略以及空间碎片管理技术;基于TH-1A的软件系统框架提出并实现了基于网络拓扑图划分的互连网络静态能量管理实现方案,构建了虚实结合的验证环境,实验结果验证了本文所提方法的有效性。

全文目录


目录  4-7
表目录  7-8
图目录  8-11
摘要  11-13
Abstract  13-16
第一章 绪论  16-30
  1.1 功耗挑战  16-19
  1.2 功耗基础  19-20
  1.3 相关工作  20-24
    1.3.1 结点机功耗优化  20-22
    1.3.2 互连网络功耗优化  22-24
  1.4 课题研究内容  24-27
    1.4.1 基于循环调度的结点机能量优化  25-26
    1.4.2 基于网络拓扑图划分的互连网络能量优化  26-27
  1.5 本文的主要贡献与创新  27
  1.6 论文结构  27-30
结点机能量优化  30-78
  第二章 面向能量优化的 OpenMP 循环调度  32-68
    2.1 能量节约的静态调度算法  35-37
    2.2 能量节约的最优静态调度算法  37-44
    2.3 改进的能量最优 OpenMP 静态调度算法  44-49
    2.4 非一致大小调度单位条件下静态调度的能量优化  49-52
    2.5 实验评估  52-68
      2.5.1 模拟实验  53-64
      2.5.2 实际测试  64-68
  第三章 能量受限的 OpenMP 静态循环调度  68-77
    3.1 能量受限的静态调度算法  69-70
    3.2 能量受限的性能最优静态调度算法  70-72
    3.3 实验评估  72-77
      3.3.1 ECSS 实验结果  72-74
      3.3.2 ECPOSS 实验结果  74-77
  小结  77-78
互连网络能量优化  78-168
  第四章 基本思想  80-92
    4.1 引言  80-82
    4.2 路由器空间维度占用性分析 VS 路由器关闭  82-84
    4.3 路由器时间维度占用性分析 VS 路由器独立关闭  84-88
    4.4 互连网络拓扑图划分 VS 路由器独立占用性  88-92
  第五章 典型网络拓扑划分  92-120
    5.1 Nd-mesh 网络  92-101
      5.1.1 维序路由规则下的 Nd-mesh 网络图划分定理  92-96
      5.1.2 方向自适应路由规则下的 Nd-mesh 网络图划分定理  96-99
      5.1.3 完全自适应路由规则下的 Nd-mesh 网络图划分定理  99-101
    5.2 Nd-torus 网络  101-108
      5.2.1 维序路由规则下的 Nd-torus 网络图划分定理  101-106
      5.2.2 方向自适应路由规则下的 Nd-torus 网络图划分定理  106-108
      5.2.3 完全自适应规则下的 Nd-torus 网络图划分定理  108
    5.3 胖树网络  108-120
      5.3.1 确定性路由规则下的胖树网络图划分定理  109-113
      5.3.2 方向自适应路由规则下的胖树网络图划分定理  113-116
      5.3.3 完全自适应路由规则下的胖树网络图划分定理  116-120
  第六章 关键技术  120-148
    6.1 不可关闭域设置技术  120-124
      6.1.1 程序不可关闭域  120-123
      6.1.2 网络不可关闭域  123-124
    6.2 拓扑感知的资源分配策略  124-128
      6.2.1 始终空闲的路由器关闭优先  124-125
      6.2.2 占用路由器独立关闭优先  125-126
      6.2.3 网络不可关闭域最小优先  126-128
    6.3 网络拓扑图划分算法  128-138
      6.3.1 Nd-mesh 网络拓扑图划分算法  128-134
      6.3.2 胖树网络拓扑图划分算法  134-138
    6.4 碎片管理技术  138-146
      6.4.1 时间碎片管理技术  138-143
      6.4.2 空间碎片管理技术  143-146
    6.5 路由器关闭  146-148
  第七章 实验  148-167
    7.1 实验环境及方法  148-152
    7.2 始终空闲的路由器关闭优先  152-154
    7.3 占用路由器(部分)独立关闭优先  154-167
      7.3.1 单作业 VS 时间维度占用  154-161
      7.3.2 多作作业 VS 网络络拓扑图划划分  161-167
  小结  167-168
第八章 结束语  168-170
  8.1 工作总结  168-169
  8.2 研究展望  169-170
致谢  170-172
参考文献  172-184
作者在学期间取得的学术成果  184-186
攻读博士期间获得的科技成果  186-188
攻读博士期间参与的科研项目  188

相似论文

  1. 基于嵌入式技术的水质分析仪关键技术的研究,TP216
  2. 光分组交换网核心节点关键技术的研究与实现,TN929.1
  3. 柴油机活塞组件的动力学研究,TK423
  4. 超高频无源RFID芯片数字基带的低功耗设计研究,TP391.44
  5. 基于复杂网络的嵌入式软件功耗优化研究,TP368.1
  6. 面向多核微处理器芯片的高效能I/O体系结构及其实现技术,TP332
  7. 提高无线视频QoS的若干技术研究,TN919.8
  8. 基于功耗优化的Pipelined ADC系统结构设计与关键单元研究,TN792
  9. 14比特50M采样率的Pipeline ADC设计研究,TN792
  10. GPU功耗建模与优化技术研究,TP391.41
  11. 嵌入式系统低功耗优化技术在肺音信号处理中的应用,TN911.7
  12. 基于情景感知的移动嵌入式设备功耗优化方法研究,TN92
  13. 飞行吸附机器人的自主控制技术研究,TP242
  14. 流水线ADC系统级功耗优化方法的研究与实现,TN792
  15. 基于FPGA的DSP系统定点化过程中的自动化功耗分析,TP368.1
  16. 相变存储器低功耗优化研究及其在多态存储中的应用,TP333
  17. DSP算法不同平台上的实现、性能研究与优化,TN431.2
  18. 体系结构级Cache功耗优化技术研究,TP332
  19. 微型声频定向系统的功耗优化方法与实现,TN643
  20. 多核处理芯片MSM7X27在智能手机中的应用研究,TN929.53

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 设计与性能分析 > 性能分析、功能分析
© 2012 www.xueweilunwen.com