学位论文 > 优秀研究生学位论文题录展示

多线程低功耗编译优化技术研究

作 者: 赵荣彩
导 师: 唐志敏
学 校: 中国科学院研究生院(计算技术研究所)
专 业: 计算机体系结构
关键词: 低功耗 多线程 编译优化 计算机体系结构 动态频率调整 软件流水
分类号: TP314
类 型: 博士论文
年 份: 2002年
下 载: 405次
引 用: 5次
阅 读: 论文下载
 

内容摘要


在近年来微处理器发展的过程中,随着系统频率和复杂度的提升以及移动应用的深入,功耗已成为系统软硬件设计所关心的关键问题。编译技术研究除了追求应用程序运行效率的最优化之外,通过编译对应用程序行为的充分分析,对不显著响程序运行性能的条件下最小化系统或处理器的运行功耗的研究,在近期很受关注。这是电路级设计很难涉足的一个有效降低功耗的潜在领域。虽然,从编译级来研究低功耗优化技术是新近发展的崭新方向,但它却含有丰富的研究内容。本博士论文重点研究基于多线程体系结构频率/电压动态调整的低功耗编译优化方法和技术。主要的研究工作体现在以下几个方面:(1)首次从多线程低功耗编译优化技术实现的角度,将目前硬件支持多线程的体系结构进行了归类划分,并根据它们的结构特性提出分为两类:CMP(Chip MultiProcessor or MultiProcessor on Chip)和SMT(Simultaneous MultiThread)来研究基于动态频率/电压调整的低功耗编译优化技术。(2)针对CMP类多线程的体系结构,研究并提出了一种基于频率动态调整的结合细粒度多线程划分的低功耗优化模型,设计了相关的算法和编译实现策略,旨在不影响充分开发应用程序ILP(Instruction Level Parallelism)和TLP(Thread Level Parallelism)的同时,尽可能有效地减少处理器的运行功耗。(3)提出了针对SMT多线程体系结构的多线程低功耗编译优化的理论模型,研究如何在编译时识别具有可使处理部件降低电压/频率执行的期望区间,在这些区间可以得到显著的功耗节省而不明显降低程序的执行性能。并设计了能量分析模型、相关算法和编译实现策略。(4)基于全局调度的循环依赖关系,使用整数线性规划(Integer Linear Programming)的形式化框架,提出了一种对给定循环进行合理有效的低功耗最优化软件流水调度的方法,使其在运行时保持性能不变而消耗的功耗/能量最小。(5)在SimWattch模拟平台上,对IXP2400网络处理器中的XScale结构进行了频率调整的低功耗模拟和分析,发现并分析了程序设计语言成分

全文目录


独创性声明  3
关于论文使用授权的说明  3-4
摘要  4-6
Abstract  6-12
第一章 绪论  12-36
  1.1 引言  12-15
  1.2 微处理器体系结构级低功耗优化设计  15-24
    1.2.1 能量分布有效体系结构  15-18
    1.2.2 支持动态电压/频率调整  18-23
    1.2.3 软件控制功耗管理  23-24
  1.3 软件低功耗技术  24-29
    1.3.1 操作系统低功耗设计  24-26
    1.3.2 低功耗编译优化设计  26-29
  1.4 模型模拟  29-33
  1.5 本文的主要研究工作  33-35
  1.6 小结  35-36
第二章 编译低功耗优化技术概述  36-45
  2.1 引言  36-37
  2.2 编译时的低功耗优化技术  37-43
    2.2.1 负载均衡以及电压和频率的动态调整  38-41
    2.2.2 系统资源功率的动态配置技术  41
    2.2.3 I/O 功耗优化技术  41-42
    2.2.4 优化任务分配,调度远程 SERVER  42
    2.2.5 提高软件流水的性能/功耗比  42-43
    2.2.6 性能优化,提高执行速度,缩短执行时间  43
  2.3 编译低功耗技术研究的基本方法  43-44
  2.4 小结  44-45
第三章 低功耗SMT 体系结构  45-60
  3.1 引言  45-48
  3.2 SMT 技术  48-54
    3.2.1 基本的处理器结构  48-49
    3.2.2 支持 SMT 的扩展  49-52
    3.2.3 SMT 的同步  52
    3.2.4 同时多线程  52-53
    3.2.5 多线程结构的执行模式  53-54
  3.3 开发并行性,转换TLP 为ILP  54-56
  3.4 多线程低功耗技术  56-59
    3.4.1 多线程低功耗体系结构  56-57
    3.4.2 多线程低功耗操作系统  57
    3.4.3 多线程低功耗编译  57-59
  3.5 小结  59-60
第四章 CMP 结构低功耗多线程的编译优化  60-76
  4.1 引言  60-61
  4.2 多线程划分模型与低功耗优化的基本思想  61-62
  4.3 低功耗模型的形式化研究  62-65
    4.3.1 基本定义  62-64
    4.3.2 功耗优化模型  64-65
    4.3.3 问题陈述  65
  4.4 功耗优化的线程划分和调度算法  65-71
    4.4.1 FittestThread 算法  66-68
    4.4.2 TestGap 算法与节点插入算法 InsertIntoThread  68-71
    4.4.3 低功耗线程调度和降频因子的计算  71
  4.5 有关线程划分算法的讨论与分析  71-74
    4.5.1 线程划分算法的实例执行过程  71-72
    4.5.2 不同的线程划分对运行功耗优/性能的影响  72-74
  4.6 基本系统运行的参考结构  74-75
  4.7 小结  75-76
第五章 SMT 结构低功耗多线程的编译优化  76-92
  5.1 引言  76-80
    5.1.1 SMT 体系结构特征  77-80
  5.2 目前低功耗技术的研究进展  80-81
    5.2.1 相关的研究  80
    5.2.2 存在的问题和我们要做的工作  80-81
  5.3 编译优化分析,指导频率调整  81-88
    5.3.1 为什么要在编译时进行?  81
    5.3.2 编译指导频率调整的分析基础  81-82
    5.3.3 基于多线程区域的δ选择  82-86
    5.3.4 基本的编译策略  86-87
    5.3.5 能量分析模型  87-88
  5.4 实例模拟分析  88-91
  5.5 小结  91-92
第六章 软件流水的低功耗编译技术研究  92-106
  6.1 引言  92-93
  6.2 问题求解示例  93-96
  6.3 对问题的ILP 形式化描述  96-102
    6.3.1 软件流水的ILP形式化描述  96-99
    6.3.2 软件流水的低功耗优化调度  99-102
  6.4 相关的研究及讨论  102-103
  6.5 小结  103-104
  本章附录:本章中的公式列表  104-106
第七章 Intel IXP 2400 低功耗技术应用研究  106-122
  7.1 引言  106-107
  7.2 Intel IXP 2400 体系结构及低功耗设计  107-111
    7.2.1 Intel XScale core 的结构  109-110
    7.2.2 Intel IXP 2400 低功耗设计特点  110-111
  7.3 模拟实验和研究分析  111-118
    7.3.1 模拟环境和模拟条件  111-112
    7.3.2 频率调整对性能和功耗的影响  112-114
    7.3.3 语言成分和控制结构的选用对性能/功耗的影响  114-118
  7.4 小结  118-119
  本章附录:图7.8--图7.11 的模拟运行程序  119-122
第八章 结束语  122-124
  8.1 本文主要贡献与创新  122-123
  8.2 下一步研究工作  123-124
参考文献  124-133
致谢  133-134
作者简历  134-135

相似论文

  1. AVS视频解码器在PC平台上的优化及场解码的改善,TN919.81
  2. 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
  3. 基于比对技术的非法网站探测系统的实现与研究,TP393.08
  4. WCDMA终端测试仪中低功耗、低杂散频率合成器的研究与设计,TN74
  5. 多功能无线鼠标的研究与设计,TP334.2
  6. 低压低功耗CMOS模拟乘法器研究与设计,TN432
  7. 嵌入式手持移动设备上地理信息展示的低功耗实现,TP311.52
  8. 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
  9. 基于65nm工艺的高性能音频∑△模数转换器的研究与实现,TN792
  10. HART无线适配器的研究与设计,TN915.05
  11. 低功耗、多主接口、多图层的液晶控制器设计,TN873.93
  12. 自适应OFDM数字基带接收器的低功耗研究,TN851
  13. 基于IPv6的无线传感器网络的移动性管理技术研究,TP212.9
  14. 基于路预测访问的低功耗高速缓存设计研究,TP333
  15. 基于C/S架构的车辆远程监控系统的设计与实现,TP277
  16. 基于多核的动态剖析加速方法研究,TP332
  17. 基于嵌入式Linux系统的低功耗方案的设计与实现,TP368.1
  18. 基于多线程图像处理机测试系统的研究,TP391.41
  19. 云备份中的双指纹校验与多线程传输技术研究,TP309.3
  20. 无源RFID标签芯片的低功耗电源管理系统,TN402
  21. 面向异构数据的低功耗传感器网络中TDMA协议的设计与实现,TP212.9

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 编译程序、解释程序
© 2012 www.xueweilunwen.com