学位论文 > 优秀研究生学位论文题录展示

GPU功耗建模与优化技术研究

作 者: 谢七曜
导 师: 祝永新
学 校: 上海交通大学
专 业: 集成电路工程
关键词: GPU通用计算 功耗优化 机器指令 功耗建模 动态频率 调节
分类号: TP391.41
类 型: 硕士论文
年 份: 2013年
下 载: 52次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着GPU(Graphic Processing Unit,图形处理器)功能越来越强大,特别是NVIDIA公司CUDA(Compute Unified DeviceArchitecture,统一计算架构)平台的推出,GPU通用计算逐渐成为高性能计算领域一个重要的发展趋势。然而,功耗问题始终是影响GPU通用计算技术发展的一个主要问题。尽管GPU的性能功耗比一般高于传统CPU(Central Processing Unit,中央处理器),但其高绝对功耗仍然会带来诸如芯片封装和散热成本上升,器件寿命和可靠性降低等问题,也不符合当今绿色计算的趋势。在学术界,GPU功耗相关领域的研究尚处于起步阶段,有很多关键技术值得探索。本文的主要工作包括:1)通过深入分析CUDA的编程模型和存储模型,研究其指令执行的特点,进而分析其汇编级PTX(ParallelThread eXecution)指令和机器指令,从计算指令运行和访存行为级提出了一个基于机器指令的GPU功耗预测模型。2)针对四类不同应用,提出了通过动态调节GPU计算能力和显存带宽在不损失性能前提下获得最低功耗的方法。并运用功耗模型预测了GPU在不同核心频率和显存频率下运行不同应用时的功耗,对优化方法进行了验证。对7个典型应用的实测证明,本文提出的功耗模型预测精度在94%以上。同时,本文提出的优化策略使四类应用的平均效能提升了14.5%。本课题受到国家863重点项目“新概念高效能计算机体系结构及系统研究开发”(No.2009AA012201)的资助。

全文目录


摘要  5-7
ABSTRACT  7-13
第一章 绪论  13-26
  1.1 课题背景  13-20
    1.1.1 GPGPU 技术  14-17
    1.1.2 从 GPGPU 到 CUDA  17-19
    1.1.3 其他多核计算架构  19-20
  1.2 GPU 功耗研究现状  20-24
    1.2.1 GPGPU 功耗概述  20-21
    1.2.2 功耗模型研究现状  21-23
    1.2.3 低功耗优化研究现状  23-24
  1.3 论文的主要内容和组织结构  24-26
    1.3.1 论文的主要工作和创新点  24-25
    1.3.2 论文的组织结构  25-26
第二章 CUDA 平台与 FERMI 架构解析  26-39
  2.1 CUDA 架构解析  26-37
    2.1.1 编程模型  27-29
    2.1.2 主机和设备  29-30
    2.1.3 计算单元硬件映射  30-33
    2.1.4 存储模型  33-36
    2.1.5 CUDA API  36-37
  2.2 实验环境  37-38
  2.3 本章小结  38-39
第三章 基于机器指令的 GPU 功耗模型的原理与实现  39-48
  3.1 功耗模型搭建原理  39
  3.2 平台搭建和干扰消除  39-41
  3.3 测试代码设计  41-42
  3.4 参数提取  42-45
    3.4.1 计算单元指令功耗  42-44
    3.4.2 存储单元功耗  44-45
  3.5 验证结果与分析  45-47
    3.5.1 应用选取标准  46
    3.5.2 选定应用简介  46
    3.5.3 应用测试结果与分析  46-47
  3.6 本章小结  47-48
第四章 模型指导下的功耗优化  48-59
  4.1 功耗优化方法  48-52
    4.1.1 功耗影响因素分析  48-49
    4.1.2 应用分类  49-50
    4.1.3 优化方法设计与实现  50-52
  4.2 模型指导下的功耗优化实验验证  52-58
    4.2.1 测试方法  52
    4.2.2 测试结果  52-55
    4.2.3 测试结果分析  55-58
  4.3 本章小结  58-59
第五章 结束语  59-61
  5.1 总结  59-60
    5.1.1 论文的主要工作  59
    5.1.2 论文的主要创新点  59-60
  5.2 工作展望  60-61
参考文献  61-65
致谢  65-66
攻读硕士学位期间已发表或录用的论文  66-67
附件  67

相似论文

  1. 比例式气液两相高温燃料流量调节阀的研究,V233.2
  2. 大型公共建筑空调系统节能运行若干问题分析,TU831.6
  3. 调环酸钙合成工艺研究及其类似物合成,TQ452
  4. FROV作业流程仿真技术研究,TP242
  5. TRAIL对肿瘤侵润CD4~+CD25~+ Treg的调节作用,R730.2
  6. 血管生成调节因子对性成熟小鼠卵泡及其血管发育的影响,S852.2
  7. 维生素A不同给药途径对持续性哮喘大鼠CD4~+CD25~+调节性T细胞及IL-4、IFN-γ细胞因子的影响,R562.25
  8. 根域限制和不同植物生长调节剂对葡萄生长发育的影响,S663.1
  9. 枯草芽孢杆菌对基质栽培黄瓜盐胁迫伤害的缓解效应,S642.2
  10. 情绪调节方式对诱发情绪下A型行为原发性高血压患者自主神经反应的影响研究,R544.1
  11. JBP485经PEPT1的摄取,转运和调节,R96
  12. 药物对机体平衡的调节作用探讨,R96
  13. 单相相位和幅值可控电压调节器的研究,TM761.1
  14. 微循环血流特征分析及其单元的模拟研究,R331
  15. “自我调节学习”在高校排球选修课教学中运用的实验研究,G842-4
  16. 基于嵌入式技术的水质分析仪关键技术的研究,TP216
  17. 基于改进蚁群算法的水轮机调节系统建模与仿真,TV734.1
  18. 人结肠癌组织中B7-H4的表达及其临床意义,R735.3
  19. 电动汽车充放储一体化电站对电网影响的研究,TM712
  20. 红叶石楠‘红罗宾’组织培养再生体系的建立和优化,S687
  21. 企业研发团队的冲突与创新绩效的关系研究,F273.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com