学位论文 > 优秀研究生学位论文题录展示
一种软硬结合的预取技术研究
作 者: 张百达
导 师: 唐玉华
学 校: 国防科学技术大学
专 业: 计算机科学与技术
关键词: 高速缓存 预取 软硬件结合 SimpleScalar NPB
分类号: TP302
类 型: 硕士论文
年 份: 2008年
下 载: 116次
引 用: 0次
阅 读: 论文下载
内容摘要
“存储墙”问题一直是影响计算机效能的挑战性问题。随着技术的发展,处理器和存储器的速度差异不断的增大,同时多核技术使得存储瓶颈更加严重。针对Cache失效中的强制性失效和容量失效,传统的硬件预取或软件预取都不能很好的改善性能,因为硬件预取只是基于程序的历史信息来预测程序未来的行为,导致了预取过于盲目;而软件预取需要增加大量额外的预取指令,造成了预取性能不佳。软硬件结合的预取技术可以很好的结合软件预取和硬件预取的优点,但仍处于研究阶段。本文对软硬件结合的数据预取技术展开了深入研究,提出了编译指导的基于访存预取表的预取技术。为了更好地利用编译信息来指导预取,本文提出了一套可视化的Cache访问特性分析方法来研究Cache的行为规律。使用该方法对实验数据分析表明:对大数组线性访问是造成Cache失效的一个关键因素。为了提高Cache性能,文中采用了增量式的研究思路,提出了基于预取触发地址的访存预测表预取技术,将编译时的访存模式信息编码到访存指令中来指导预取的进行。该技术有效避免了传统顺序预取方法预取效率低的问题,可以有效的降低Cache失效率。同时,提出了将Evict Me和编译指导的访存预测表预取相结合的技术,用来解决预取数据的替换问题。该技术可以避免预取带来的Cache抖动问题,有效降低对访存带宽的需求。最后,我们在SimpleScalar平台上实现了上述的技术,选用了NPB测试集进行了性能的测试。测试结果表明,编译指导的访存预测表预取技术可以在有效隐藏访存延时,提高Cache命中率,减少程序的执行时间。并且在结合了Evict Me技术后,能够进一步提高存储系统的性能。
|
全文目录
摘要 10-11 ABSTRACT 11-12 第一章 绪论 12-16 1.1 课题背景 12-13 1.2 研究现状 13-14 1.3 本文工作 14 1.4 论文结构 14-16 第二章 相关研究工作 16-25 2.1 基本概念 16-20 2.1.1 局部性原理 16 2.1.2 层次存储结构的基本概念 16-19 2.1.3 访存模式 19-20 2.2 相关工作 20-24 2.2.1 预取技术 20-22 2.2.2 软件管理的Cache技术 22-23 2.2.3 编译器优化技术 23-24 2.3 小结 24-25 第三章 对 Cache失效问题的研究 25-31 3.1 现状及意义 25 3.2 NPB的Cache行为分析 25-29 3.2.1 可视化的分析方法 25-28 3.2.2 分析与统计 28-29 3.3 小结 29-31 第四章 软硬件结合的预取技术研究 31-46 4.1 编译指导的失效时预取 31-35 4.1.1 基本思想 32-33 4.1.2 编译指导的失效时预取 33-35 4.1.3 设置预取标志位的编译算法框架 35 4.2 编译指导的基于访存预测表的预取技术 35-42 4.2.1 基本思想 35-38 4.2.2 对RPT技术的改进 38 4.2.3 编译指导的RPT技术 38-41 4.2.4 设置预取标志位的编译算法框架 41-42 4.3 编译指导的基于访存预测表的预取+编译指导的替换策略 42-45 4.3.1 基本思想 42 4.3.2 实现 42-43 4.3.3 设置替换标志位的编译算法框架 43-45 4.4 小结 45-46 第五章 性能评测 46-57 5.1 测试环境 46-48 5.1.1 模拟器 46-48 5.1.2 Benchmark 48 5.2 测试方案 48-49 5.3 实验结果分析 49-56 5.3.1 编译指导的失效时预取技术性能分析 49-53 5.3.2 编译指导的基于访存预测表的预取技术性能分析 53-54 5.3.3 编译指导替换策略和预取的基于访存预测表的预取技术性能分析 54-56 5.4 小结 56-57 第六章 结束语 57-59 6.1 主要工作 57 6.2 未来展望 57-59 致谢 59-60 参考文献 60-63 攻读硕士学位期间取得的学术成果 63-64 攻读硕士学位期间参加的科研工作 64
|
相似论文
- 基于函数动态重用的处理器性能优化研究,TP332
- 高效能嵌入式处理器IP核,TP332
- 面向星载计算机的容错并行算法研究与实现,TP302.8
- 分组交换网仿真技术与算法研究,TN915.09
- 基于SOPC的JPEG2000静止图像编码器设计,TN762
- 基于数据重用机制的超标量处理器分支预测研究,TP332
- 载流子传输特性对基于铱化合物磷光有机电致发光器件的影响,TN383.1
- 多媒体应用程序子字并行自动识别关键技术研究,TP391.4
- 基于软件Agent的提高大型数据库操纵效率机制研究,TP311.13
- 基于互联网的2.5维虚拟场景的研究与实现,TP391.9
- 广域传感器数据库中缓存与查询技术的研究,TP311.13
- 嵌入式处理器指令预取关键技术设计研究,TP368.11
- P2P VOD系统网络拓扑模型研究,TN948.64
- ATLAS在龙芯2F上的访存优化,TP332
- 嵌入式微处理器中动态可配置Cache结构的研究,TP332
- 基于PowerPC片上高速缓存的设计,TP333
- 采用基树的磁盘阵列Cache技术研究,TP333.35
- 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
- 基于虚拟计算环境的内存资源共享技术研究,TP393.09
- 面向分布构件平台的持久化技术研究,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 设计与性能分析
© 2012 www.xueweilunwen.com
|