学位论文 > 优秀研究生学位论文题录展示
GPU功耗建模与优化技术研究
作 者: 谢七曜
导 师: 祝永新
学 校: 上海交通大学
专 业: 集成电路工程
关键词: GPU通用计算 功耗优化 机器指令 功耗建模 动态频率 调节
分类号: TP391.41
类 型: 硕士论文
年 份: 2013年
下 载: 52次
引 用: 0次
阅 读: 论文下载
内容摘要
随着GPU(Graphic Processing Unit,图形处理器)功能越来越强大,特别是NVIDIA公司CUDA(Compute Unified DeviceArchitecture,统一计算架构)平台的推出,GPU通用计算逐渐成为高性能计算领域一个重要的发展趋势。然而,功耗问题始终是影响GPU通用计算技术发展的一个主要问题。尽管GPU的性能功耗比一般高于传统CPU(Central Processing Unit,中央处理器),但其高绝对功耗仍然会带来诸如芯片封装和散热成本上升,器件寿命和可靠性降低等问题,也不符合当今绿色计算的趋势。在学术界,GPU功耗相关领域的研究尚处于起步阶段,有很多关键技术值得探索。本文的主要工作包括:1)通过深入分析CUDA的编程模型和存储模型,研究其指令执行的特点,进而分析其汇编级PTX(ParallelThread eXecution)指令和机器指令,从计算指令运行和访存行为级提出了一个基于机器指令的GPU功耗预测模型。2)针对四类不同应用,提出了通过动态调节GPU计算能力和显存带宽在不损失性能前提下获得最低功耗的方法。并运用功耗模型预测了GPU在不同核心频率和显存频率下运行不同应用时的功耗,对优化方法进行了验证。对7个典型应用的实测证明,本文提出的功耗模型预测精度在94%以上。同时,本文提出的优化策略使四类应用的平均效能提升了14.5%。本课题受到国家863重点项目“新概念高效能计算机体系结构及系统研究开发”(No.2009AA012201)的资助。
|
全文目录
摘要 5-7 ABSTRACT 7-13 第一章 绪论 13-26 1.1 课题背景 13-20 1.1.1 GPGPU 技术 14-17 1.1.2 从 GPGPU 到 CUDA 17-19 1.1.3 其他多核计算架构 19-20 1.2 GPU 功耗研究现状 20-24 1.2.1 GPGPU 功耗概述 20-21 1.2.2 功耗模型研究现状 21-23 1.2.3 低功耗优化研究现状 23-24 1.3 论文的主要内容和组织结构 24-26 1.3.1 论文的主要工作和创新点 24-25 1.3.2 论文的组织结构 25-26 第二章 CUDA 平台与 FERMI 架构解析 26-39 2.1 CUDA 架构解析 26-37 2.1.1 编程模型 27-29 2.1.2 主机和设备 29-30 2.1.3 计算单元硬件映射 30-33 2.1.4 存储模型 33-36 2.1.5 CUDA API 36-37 2.2 实验环境 37-38 2.3 本章小结 38-39 第三章 基于机器指令的 GPU 功耗模型的原理与实现 39-48 3.1 功耗模型搭建原理 39 3.2 平台搭建和干扰消除 39-41 3.3 测试代码设计 41-42 3.4 参数提取 42-45 3.4.1 计算单元指令功耗 42-44 3.4.2 存储单元功耗 44-45 3.5 验证结果与分析 45-47 3.5.1 应用选取标准 46 3.5.2 选定应用简介 46 3.5.3 应用测试结果与分析 46-47 3.6 本章小结 47-48 第四章 模型指导下的功耗优化 48-59 4.1 功耗优化方法 48-52 4.1.1 功耗影响因素分析 48-49 4.1.2 应用分类 49-50 4.1.3 优化方法设计与实现 50-52 4.2 模型指导下的功耗优化实验验证 52-58 4.2.1 测试方法 52 4.2.2 测试结果 52-55 4.2.3 测试结果分析 55-58 4.3 本章小结 58-59 第五章 结束语 59-61 5.1 总结 59-60 5.1.1 论文的主要工作 59 5.1.2 论文的主要创新点 59-60 5.2 工作展望 60-61 参考文献 61-65 致谢 65-66 攻读硕士学位期间已发表或录用的论文 66-67 附件 67
|
相似论文
- 比例式气液两相高温燃料流量调节阀的研究,V233.2
- 大型公共建筑空调系统节能运行若干问题分析,TU831.6
- 调环酸钙合成工艺研究及其类似物合成,TQ452
- FROV作业流程仿真技术研究,TP242
- TRAIL对肿瘤侵润CD4~+CD25~+ Treg的调节作用,R730.2
- 血管生成调节因子对性成熟小鼠卵泡及其血管发育的影响,S852.2
- 维生素A不同给药途径对持续性哮喘大鼠CD4~+CD25~+调节性T细胞及IL-4、IFN-γ细胞因子的影响,R562.25
- 根域限制和不同植物生长调节剂对葡萄生长发育的影响,S663.1
- 枯草芽孢杆菌对基质栽培黄瓜盐胁迫伤害的缓解效应,S642.2
- 情绪调节方式对诱发情绪下A型行为原发性高血压患者自主神经反应的影响研究,R544.1
- JBP485经PEPT1的摄取,转运和调节,R96
- 药物对机体平衡的调节作用探讨,R96
- 单相相位和幅值可控电压调节器的研究,TM761.1
- 微循环血流特征分析及其单元的模拟研究,R331
- “自我调节学习”在高校排球选修课教学中运用的实验研究,G842-4
- 基于嵌入式技术的水质分析仪关键技术的研究,TP216
- 基于改进蚁群算法的水轮机调节系统建模与仿真,TV734.1
- 人结肠癌组织中B7-H4的表达及其临床意义,R735.3
- 电动汽车充放储一体化电站对电网影响的研究,TM712
- 红叶石楠‘红罗宾’组织培养再生体系的建立和优化,S687
- 企业研发团队的冲突与创新绩效的关系研究,F273.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|