学位论文 > 优秀研究生学位论文题录展示
基于函数动态重用的处理器性能优化研究
作 者: 刘宇
导 师: 傅忠传
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 超标量处理器 SimpleScalar 函数级动态重用
分类号: TP332
类 型: 硕士论文
年 份: 2008年
下 载: 4次
引 用: 0次
阅 读: 论文下载
内容摘要
现代计算机的性能主要由每周期所执行的指令数(IPC)来衡量,而现代计算机的体系结构依靠指令级并行来改善性能。为了获得更高的IPC,需要尽可能多的以潜在的顺序而不是程序序列定义的顺序来并行执行不相关的指令。增加同时发射的指令数量通常使用的是静态的超长指令字技术或者动态的超标量技术。为了将指令尽可能早的插入到执行流水线中来减少流水线的停顿,从而引入了前瞻技术。近年来前瞻技术引起了人们广泛的研究兴趣,其中包括分支预测技术、值预测技术和地址预测技术等。但是,应该注意到这些前瞻技术潜在的目的是体系结构在前瞻模式下执行指令的能力和当前瞻失败时取消结果的能力。在前瞻技术增加IPC数量的同时,指令的有效执行时间没有被减少,即在一定情况下有效执行时间被增加用来计算恢复错误的前瞻。虽然前瞻技术能增加IPC,但不能必要的增加有效指令执行的数量。为进一步提高处理器性能,研究者们探索了重用技术,并成为近年来体系结构设计者关注的热点。重用技术是非前瞻的技术,它通过调用缓存的先前执行结果来跳过有效指令的执行。重用技术按照粒度划分为指令级重用、基本块级重用和踪迹级重用。本文沿着重用技术由细粒度向粗粒度的这一发展趋势,探索了更粗粒度的函数级重用技术。函数级动态重用技术的基本思想是,在处理器运行的过程中,对函数特征进行动态抓取,并缓存函数特征信息至函数重用表中,当此函数被再次调用时,遍历函数重用表,如果与先前执行的函数信息相匹配,就直接调用先前函数的执行结果来跳过函数体的重复执行,更新处理器的状态,继续此函数后续指令的执行;如果重用表中没有相匹配的函数信息,则继续此函数体的执行,并在执行结束返回结果的同时,将函数的输入输出信息缓存至函数重用表,以备下次重用。函数级动态重用技术是以函数为单位,通过减少单位时间内执行的指令数,甚至不执行冗余函数而直接重用来实现。函数级动态重用技术是一种粗粒度级的重用技术,把函数重用技术应用到处理器体系结构的设计中,可以提高处理器的资源利用率,提高处理器性能、降低功耗。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-19 1.1 课题背景 9-10 1.2 国内外研究现状综述 10-15 1.2.1 值预测 10 1.2.2 指令重用技术 10-12 1.2.3 值预测与指令重用的关系 12-13 1.2.4 基本块重用和踪迹重用 13-14 1.2.5 函数级重用 14-15 1.3 课题来源及意义 15-16 1.4 本文主要研究内容 16-18 1.4.1 纯函数 16 1.4.2 纯函数的识别和特征提取 16-17 1.4.3 函数重用表的建立 17 1.4.4 函数重用表的更新 17 1.4.5 评测方案 17-18 1.5 本文结构 18-19 第2章 模拟环境及实验配置 19-28 2.1 模拟器 19-23 2.1.1 SimpleScalar模拟器 19-20 2.1.2 SimpleScalar流水线 20-22 2.1.3 SimpleScalar微结构 22-23 2.2 测试集 23-25 2.2.1 SPEC95 测试基准 23-24 2.2.2 Mibench测试基准 24-25 2.3 处理器基线配置 25-27 2.4 本章小结 27-28 第3章 函数重用技术处理器设计 28-50 3.1 引言 28 3.2 函数级动态重用技术 28-36 3.2.1 纯函数的概念 28-29 3.2.2 函数信息的识别 29-31 3.2.3 函数重用表的结构 31-35 3.2.4 函数重用检索及函数重用信息表的更新 35-36 3.3 函数动态重用处理器总体结构 36-40 3.3.1 处理器结构特点 36-37 3.3.2 主要数据结构 37-40 3.4 处理器微结构设计 40-49 3.4.1 取指段 41-42 3.4.2 指令解码和分配 42-45 3.4.3 指令发射与执行 45-46 3.4.4 指令执行结果回写 46-48 3.4.5 指令提交 48-49 3.5 本章小结 49-50 第4章 实验评测与数据分析 50-56 4.1 实验评测方案 50-51 4.2 极限情况下函数动态重用实验 51-52 4.3 历史深度对重用率的影响 52-54 4.4 函数重用对处理器贡献 54-55 4.5 本章小结 55-56 结论 56-58 参考文献 58-63 致谢 63
|
相似论文
- 基于数据重用机制的超标量处理器分支预测研究,TP332
- 多媒体应用程序子字并行自动识别关键技术研究,TP391.4
- 面向循环级数组访问的数据预取技术研究,TP332
- 异质媒体双发射处理器的设计研究,TP368.11
- 处理器性能分析模型研究,TP332
- Cache低功耗技术研究及SimpleScalar模拟器分析,TP332
- 基于SimpleScalar的拥有存储与总线扩展能力的异构多核仿真器,TP391.9
- 一种软硬结合的预取技术研究,TP302
- 基于SOPC的可穿戴机多处理器设计,TP332
- 处理器TI DSP VC33虚拟核的设计与实现,TP332
- 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
- 面向存储器完整性验证的Cache设计,TP332
- 基于宏单元异步乘法器的研究与设计,TP332.22
- 嵌入式处理器中多媒体加速单元的研究,TP332
- 多核系统中实时任务调度算法的研究,TP332
- 高效能嵌入式处理器IP核,TP332
- 基于多核的动态剖析加速方法研究,TP332
- 多处理器单调速率任务调度算法研究,TP332
- 深亚微米工艺下微处理器体系结构级功耗模型相关技术研究,TP332
- 面向密集数据并行计算的可重构线性阵列处理器架构的设计,TP332
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com
|