学位论文 > 优秀研究生学位论文题录展示
分片式处理器体系结构上的超块优化技术
作 者: 曾斌
导 师: 安虹
学 校: 中国科学技术大学
专 业: 计算机系统结构
关键词: 分片式处理器体系结构 超块优化 基本块特征 剖析信息
分类号: TP332
类 型: 硕士论文
年 份: 2009年
下 载: 5次
引 用: 0次
阅 读: 论文下载
内容摘要
在过去的十年中,微处理器的性能以每年大约50-60%的速度提升。然而,随着芯片制造工艺逐步接近硅原子的尺寸,微处理器学术界和工业界面临着诸多尚待解决的问题:比如处理器功耗快速增长导致散热量的快速增加,芯片内部线延迟加长导致信号在单个时钟周期内所能到达的功能部件数目减少等一系列问题,处理器性能提升的两架马车——时钟频率和IPC (Instructions Per Cycle)正在失去以往的前进动力。种种迹象表明传统的处理器体系结构已经不能适应新的制造工艺的发展,各研究团队相继开发了新的处理器体系结构来取代传统的处理器体系结构,比如分片式处理器体系结构等。于此同时,新的分片式处理器体系结构对编译技术也提出了新的要求,超块形成和优化技术与分片式处理器体系结构之间的无缝融合成了值得研究的领域。本文研究了分片式处理器体系结构的优点和潜力以及它和超块形成和优化技术之间的结合性,探讨了分片式处理器体系结构上指令之间的直接数据传送问题,提出了基于剖析信息和关键路径长度的软件扇出树生成算法与基于基本块特征的MOV指令精简启发式算法,给出了它们的理论分析,在TRIPS编译器和调度器上实现了算法并对其进行了实验性能测试。基于剖析信息和关键路径长度的软件扇出树生成算法利用了程序剖析信息和块的静态特征,改进了Huffman算法并创新性地把它运用到了软件扇出树生成领域,该算法可以优化软件扇出树的结构,优先给执行概率高和处于关键路径上的指令播送数据,因而可以提高程序块的ILP。基于基本块特征的MOV指令精简启发式算法利用程序基本块的特征信息,比如依赖链首尾宽度比、依赖链长度以及分支指令的跳转概率等信息来指导谓词化过程,该算法可以有效地减少块内MOV指令数,提高块内有效指令比例,降低由谓词化所带来的执行延迟。本文的研究表明分片式处理器体系结构和超块技术之间可以很好地融合,分片式处理器体系结构可以利用超块结构来暴露程序中的ILP给硬件执行基底,块内指令之间的直接数据通信也可以在分片式处理器体系结构上作为全局命名空间机制的补充得到应用。块内指令之间直接通信模式的代价可以通过基于基本块特征的MOV指令精简算法和基于剖析信息和关键路径长度的软件扇出树生成算法来有效降低。此外,本文的研究也说明了剖析信息可以在调度器中得到很好地应用。
|
全文目录
摘要 4-5 ABSTRACT 5-13 第1章 绪论 13-20 1.1 课题研究背景 13-16 1.2 谓词执行技术相关工作 16-18 1.3 本文的研究工作 18-19 1.4 本文的组织结构 19-20 第2章 分片式处理器体系结构介绍 20-34 2.1 RAW 处理器体系结构介绍 21-25 2.1.1 微型可复制单元 22-23 2.1.2 可编程的整合互联网络 23 2.1.3 控制 23-24 2.1.4 多粒度操作 24 2.1.5 可配置性 24-25 2.2 EDGE 处理器体系结构介绍 25-33 2.2.1 TRIPS 的超块编译 27-29 2.2.2 TRIPS 编译 29-30 2.2.3 超块形成 30-31 2.2.4 谓词执行 31 2.2.5 生成合理的超块 31-32 2.2.6 物理调度 32 2.2.7 对并行性的支持 32-33 2.3 本章小结 33-34 第3章 超块形成和优化技术 34-56 3.1 SCALE 编译器介绍 34-37 3.2 TRIPS 后端 37-39 3.3 块选择 39-40 3.4 代码转换 40-44 3.4.1 尾复制 40-42 3.4.2 循环剥离技术 42-43 3.4.3 节点分裂 43-44 3.5 IF 转换 44-48 3.5.1 支配者和反支配者 45-47 3.5.2 RK 算法 47-48 3.6 谓词化相关的优化 48-52 3.6.1 指令提升 48-50 3.6.2 重命名和提升 50-51 3.6.3 指令合并 51-52 3.7 谓词层次图 52-54 3.8 传统优化 54 3.9 调度 54-55 3.10 本章小节 55-56 第4章 MOV 指令精简启发式算法 56-66 4.1 MOV 指令的产生 56-57 4.2 MOV 指令比例 57-59 4.3 相关工作 59-61 4.3.1 传统谓词化方法 59-60 4.3.2 隐式谓词方法 60 4.3.3 推测提升方法 60-61 4.4 基于基本块特征值的MOV 指令精简启发式算法 61-63 4.4.1 影响谓词化过程的基本块特征信息 61-62 4.4.2 启发式函数 62-63 4.5 实验性能 63-64 4.5.1 MOV 指令比例 63-64 4.5.2 执行周期数 64 4.6 本章小结 64-66 第5章 基于剖析信息和关键路径长度的软件扇出树生成算法 66-75 5.1 研究背景 66-67 5.2 相关工作 67-68 5.2.1 Huffman 编码算法 67 5.2.2 Hartley 和Casavant 算法 67-68 5.3 基于剖析信息和关键路径长度的软件扇出树生成算法 68-71 5.3.1 算法思想 68-70 5.3.2 算法复杂度分析 70 5.3.3 软件扇出树的生成过程 70-71 5.4 实验结果 71-73 5.5 本章小结 73-75 第6章 论文总结 75-77 6.1 研究成果与创新 75-76 6.2 进一步研究工作 76-77 致谢 77-78 在读期间发表的学术论文与取得的研究成果 78-79 参考文献 79-82 在读期间参与的科研项目 82
|
相似论文
- 分片式处理器一级数据缓存的设计与优化,TP332
- 类数据流驱动的分片式处理器体系结构,TP332
- 基于SOPC的可穿戴机多处理器设计,TP332
- 基于函数动态重用的处理器性能优化研究,TP332
- 处理器TI DSP VC33虚拟核的设计与实现,TP332
- 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
- 面向存储器完整性验证的Cache设计,TP332
- 基于宏单元异步乘法器的研究与设计,TP332.22
- 嵌入式处理器中多媒体加速单元的研究,TP332
- 多核系统中实时任务调度算法的研究,TP332
- 高效能嵌入式处理器IP核,TP332
- 多核系统中基于温度限制的节能调度算法研究,TP332
- 基于锁感知的多处理机VCPU调度系统,TP332
- 基于JTAG的ARM11调试软件的设计与实现,TP332
- 虚拟计算环境中CPU开销的测量系统,TP332
- 基于多核的动态剖析加速方法研究,TP332
- 多处理器单调速率任务调度算法研究,TP332
- 深亚微米工艺下微处理器体系结构级功耗模型相关技术研究,TP332
- 面向密集数据并行计算的可重构线性阵列处理器架构的设计,TP332
- 基于共享前端的流多核体系结构关键技术研究,TP332
- 高性能微处理器RTL级和体系结构级低功耗设计关键技术研究,TP332
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com
|