学位论文 > 优秀研究生学位论文题录展示

大规模异构并行系统软件低功耗优化关键技术研究

作 者: 王桂彬
导 师: 杨学军
学 校: 国防科学技术大学
专 业: 计算机科学与技术
关键词: 异构并行系统 GPU 低功耗 优化技术
分类号: TP338
类 型: 博士论文
年 份: 2011年
下 载: 93次
引 用: 0次
阅 读: 论文下载
 

内容摘要


绿色计算是当前高性能计算领域最为关注的话题之一,降低系统功耗、提高系统效能是维持超级计算机向更大规模系统发展的重要途径。异构并行系统已成为当前高性能计算机系统发展的重要趋势之一,与传统同构并行系统相比,集成有专用加速部件的异构并行系统具有更高的峰值计算速度和峰值效能。然而,由于异构处理器间计算速度和功耗开销的不同,已有的面向同构系统的功耗优化方法难以高效应用于异构并行系统。本文针对异构系统的功耗优化问题展开研究,主要工作与创新包括:1.提出异构系统功耗感知的并行循环调度方法(第二章)并行循环是科学与工程计算程序中的主要优化对象,文章以类OpenMP并行程序为研究对象,研究在满足性能约束的条件下结合异构系统并行循环调度和处理器动态电压频率调节技术优化系统功耗。首先建立了异构系统功耗感知的并行循环调度问题基本模型,然后通过分析方法给出异构系统并行循环调度的能耗下界,该下界可用于评估功耗优化方法的执行效率。进而,将异构系统并行循环调度问题归纳为一般整数规划问题,给出了该问题的求解方法。2.提出异构系统功耗感知的多计算段频率调节与任务划分方法(第三章)并行程序一般由多个串行段和并行段程序组成,根据并行计算段是否由异构处理器并行完成,文章将异构并行程序划分为同构计算段程序和异构计算段程序。针对同构计算段程序,首先建立了各计算段能耗与执行时间的关系;进而分析得出在总执行时间约束的条件下,多计算段程序达到能耗最优的条件,并给出能耗最优的计算段运行频率选择算法。针对异构计算段程序,首先分析得出时间约束下异构并行处理在单并行段内达到能耗最优的条件,进而建立各计算段能耗与执行时间的关系。在给定执行时间的约束下,将多计算段程序能耗问题描述为一般多元极值问题,并给出了基于最优下降的启发式求解算法。3.提出异构系统通信感知的全程序能耗优化方法(第四章)当前异构并行系统中,主处理器与加速部件大都通过系统总线连接,调用加速部件执行特定计算过程的同时必然伴随不可忽略的通信开销,因此应综合考虑加速部件引入的计算能耗和通信能耗以最小化系统整体能耗开销。文章提出了两种优化方法:基于整数线性规划的静态能耗优化方法和基于遗传算法的动态能耗优化方法,在满足性能约束的条件下优化全系统能耗开销。静态优化方法将并行任务的划分和调度以及处理器频率选择过程描述为整数线性规划问题,给出了该问题的最优解求解方法。动态优化方法在程序的执行过程中依据程序历史执行信息,反复应用通信感知的任务划分算法和动态频率调节算法在线优化程序能耗开销。4.提出异构系统应用感知的最大功耗管理方法(第五章)随着系统功耗不断增大,功耗不仅是系统优化的目标之一,而且逐渐成为影响系统设计与实现的重要约束之一。针对多道程序在异构并行系统上的执行模型,文章提出了一种层次化的最大功耗管理策略,旨在满足系统功耗约束的条件下,优化系统整体性能。首先对当前异构并行系统执行模型进行了抽象,并提出了融合三级功耗控制机制的系统功耗管理框架。在异构并行处理引擎级功耗控制中,文章提出了应用感知的最大功耗管理方法。首先,通过分析方法给出了异构处理器在给定功耗约束的条件下达到性能最优的条件。基于该结果,给出了功耗受限的并行任务划分算法,该方法通过协调并行任务划分和动态电压频率调节技术以优化异构并行处理。在异构并行处理组级功耗控制中,提出了基于关键线程的功耗划分策略,将功耗优先分配给处于关键路径上的线程;在系统级功耗控制中,我们建立了异构并行处理组效能评估方法,以此作为功耗划分的依据,在兼顾并发应用公平性的同时,提高系统整体执行效能。

全文目录


摘要  10-12
ABSTRACT  12-15
第一章 绪论  15-35
  1.1 异构并行系统是当前高性能计算机系统发展趋势之一  15-17
  1.2 大规模异构并行系统面临的主要挑战  17-21
  1.3 相关工作  21-29
    1.3.1 性能约束下的功耗优化研究  21-24
    1.3.2 功耗约束下的性能优化研究  24-26
    1.3.3 异构多核处理器功耗优化研究  26-27
    1.3.4 基于加速部件的异构系统功耗优化研究  27-29
  1.4 本文的研究内容  29-31
  1.5 本文的主要贡献与创新  31-33
    1.5.1 异构系统功耗感知的并行循环调度方法  31
    1.5.2 异构系统功耗感知的多计算段频率调节与任务划分方法  31-32
    1.5.3 异构系统通信感知的全程序能耗优化方法  32
    1.5.4 异构系统应用感知的最大功耗管理方法  32-33
  1.6 论文结构  33-35
第二章 异构系统功耗感知的并行循环调度方法  35-55
  2.1 模型与概念  35-37
  2.2 异构系统并行循环调度方法  37-44
    2.2.1 给定循环调度的处理器最优频率求解  38-40
    2.2.2 并行循环调度能耗下界分析  40-41
    2.2.3 并行循环调度问题优化  41-44
  2.3 编译实现  44-46
    2.3.1 算法实现  45-46
    2.3.2 代码示例  46
  2.4 实验评估  46-53
    2.4.1 测试平台  46-47
    2.4.2 测试用例  47-48
    2.4.3 结果分析  48-53
  2.5 小结  53-55
第三章 异构系统功耗感知的多计算段频率调节与任务划分方法  55-77
  3.1 同构计算段程序能耗优化方法  56-61
    3.1.1 建立同构计算段能耗模型  56-58
    3.1.2 能耗最优的处理器频率求解方法  58-61
  3.2 异构计算段程序能耗优化方法  61-66
    3.2.1 建立并行段最优能耗与执行时间的关系  61-63
    3.2.2 临界区操作对能耗优化的影响  63-66
    3.2.3 基于最优下降的启发式求解算法  66
  3.3 实验评估  66-74
    3.3.1 测试平台  66-67
    3.3.2 测试用例  67-68
    3.3.3 实验结果与分析  68-74
  3.4 小结  74-77
第四章 异构系统通信感知的全程序能耗优化方法  77-97
  4.1 问题的提出  77-79
  4.2 基于整数线性规划的静态最优能耗优化方法  79-84
    4.2.1 应用模型  79-80
    4.2.2 系统模型  80-81
    4.2.3 性能模型  81
    4.2.4 基于ILP 的问题求解  81-84
  4.3 基于遗传算法的动态自适应能耗优化方法  84-88
    4.3.1 动态频率调节算法  85-86
    4.3.2 通信感知的任务划分算法  86-88
  4.4 实验评估  88-96
    4.4.1 案例分析  88-93
    4.4.2 模拟实验  93-96
  4.5 小结  96-97
第五章 异构系统应用感知的最大功耗管理方法  97-119
  5.1 问题的提出  98-99
  5.2 异构并行系统模型与功耗控制框架  99-101
  5.3 异构并行处理引擎功耗控制方法  101-106
  5.4 异构并行处理组功耗控制方法  106-107
  5.5 系统级功耗控制方法  107-108
  5.6 实验评估与分析  108-116
    5.6.1 测试用例  109-110
    5.6.2 实验评估  110-116
  5.7 小结  116-119
第六章 结束语  119-123
  6.1 工作总结  119-120
  6.2 研究展望  120-123
致谢  123-125
参考文献  125-141
作者在学期间取得的学术成果  141-144

相似论文

  1. WCDMA终端测试仪中低功耗、低杂散频率合成器的研究与设计,TN74
  2. 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
  3. 多功能无线鼠标的研究与设计,TP334.2
  4. 低压低功耗CMOS模拟乘法器研究与设计,TN432
  5. 嵌入式手持移动设备上地理信息展示的低功耗实现,TP311.52
  6. 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
  7. 基于GPU的有限元方法研究,O241.82
  8. 基于65nm工艺的高性能音频∑△模数转换器的研究与实现,TN792
  9. HART无线适配器的研究与设计,TN915.05
  10. 低功耗、多主接口、多图层的液晶控制器设计,TN873.93
  11. 自适应OFDM数字基带接收器的低功耗研究,TN851
  12. 基于IPv6的无线传感器网络的移动性管理技术研究,TP212.9
  13. 基于路预测访问的低功耗高速缓存设计研究,TP333
  14. 基于嵌入式Linux系统的低功耗方案的设计与实现,TP368.1
  15. 基于图形处理器的SIFT算法研究,TP391.41
  16. 基于GPU图像搜索中文本检索的关键技术研究,TP391.1
  17. 基于GPU/CPU多级并行CFD优化策略的研究,V221
  18. 无源RFID标签芯片的低功耗电源管理系统,TN402
  19. 基于ffmpeg的高性能高清流媒体播放器软件设计,TN919.8
  20. 增强现实系统中火焰特效关键技术研究,TP391.9
  21. 基于多图形处理器的高效波动声学模拟器及其应用,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机
© 2012 www.xueweilunwen.com