学位论文 > 优秀研究生学位论文题录展示

面向小容量指令缓存的软件优化技术

作 者: 陈辰
导 师: 罗小华; 黄凯
学 校: 浙江大学
专 业: 电气工程
关键词: 高速缓存 优化的缓存块着色算法 过程排序 缓存锁定 选择性不缓存
分类号: TP311.5
类 型: 硕士论文
年 份: 2014年
下 载: 1次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着集成电路制造工艺的和计算机体系结构的不断进步,处理器与存储器之间速度的差距也越来越大,处理器读取指令的速度对处理器性能的发挥产生了极大的影响。因此如何提高处理器指令高速缓存的性能,从而提高处理器性能成为研究的焦点。尤其在低成本的嵌入式处理器中,为了降低成本,通常采用小容量的缓存,此时,指令缓存命中率对性能的影响尤为显著。本文针对小容量缓存缺失的特点,从软件优化的角度,提出了几种指令高速缓存的优化方法。针对原始高速缓存软件优化计算方法复杂、适用性差的特点,提出基于统计分析方法的指令高速缓存的软件优化技术,采用gcov和gprof工具对代码静态分析,能大量减低优化过程中的计算复杂度,针对PH算法、缓存块着色算法没有将缓存大小、程序大小、缓存块大小考虑在内,在子函数大小接近或大于缓存大小时,优化效果不佳的特点,提出了优化的缓存块着色算法,在进行着色排序之前,先判断子函数的大小,将过大的子函数进行拆分。本文提出了“缓存锁定选择排序”公式,用于评估判断选择代码段是否锁定或不缓存,大大简化了选择锁定内容时的计算。实验表明,缓存的软件优化技术能使程序执行时间平均减少8%,缓存命中率平均提高23%,有明显的优化效果。

全文目录


致谢  4-5
摘要  5-6
Abstract  6-7
目录  7-10
图目录  10-11
表目录  11-12
1 绪论  12-19
  1.1 课题背景  12-14
    1.1.1 高速缓存的意义  12-13
    1.1.2 高速缓存优化思路  13-14
  1.2 研究现状  14-16
  1.3 本文工作  16-17
    1.3.1 指令缓存优化技术的研究  16-17
    1.3.2 GCC编译器中gcov和gprof工具流程分析  17
    1.3.3 面向小容量缓存的优化技术实现  17
  1.4 论文结构  17-19
2 高速缓存原理概述  19-27
  2.1 高速缓存的原理  19-21
    2.1.1 缓存命中  20
    2.1.2 缓存缺失  20
    2.1.3 缓存替换  20-21
  2.2 高速缓存的组织形式  21-22
  2.3 高速缓存的性能  22-24
    2.3.1 高速缓存的性能指标  22
    2.3.2 高速缓存容量对性能的影响  22
    2.3.3 高速缓存块大小对性能的影响  22-23
    2.3.4 相连度对性能的影响  23
    2.3.5 写策略对缓存性能的影响  23-24
  2.4 高速缓存的常用优化方法介绍  24-26
    2.4.1 局部性原理  24-25
    2.4.2 指令预取  25-26
    2.4.3 关键词优先  26
    2.4.4 路预测  26
  2.5 本章小结  26-27
3 基于gcov和gprof的统计分析方法  27-38
  3.1 基于gcov的代码覆盖率与执行次数统计  27-33
    3.1.1 代码覆盖率基本概念  27-28
    3.1.2 gcov简介  28
    3.1.3 gcvo工作流程  28-30
    3.1.4 gcov工作原理  30-32
    3.1.5 gcvo优缺点分析  32-33
  3.2 基于gprof的代码调用信息统计  33-37
    3.2.1 gprof简介  33-34
    3.2.2 gprof工作原理  34
    3.2.3 gprof工作流程  34-36
    3.2.4 gprof优缺点分析  36-37
  3.3 本章小结  37-38
4 指令高速缓存优化技术  38-49
  4.1 针对小容量缓存优化的过程排序  38-44
    4.1.1 PH算法中的过程排序  38-39
    4.1.2 缓存块着色算法  39-42
    4.1.3 针对小容量缓存的优化  42-44
  4.2 基于gcov信息的地址段静态锁定  44-46
  4.3 基于gcov信息的代码段选择性不缓存  46-47
  4.4 本章小结  47-49
5 优化技术实现  49-59
  5.1 仿真平台  49-51
    5.1.1 CK803处理器  49-50
    5.1.2 缓存命中率统计工具  50-51
  5.2 仿真流程  51-52
  5.3 优化技术实现  52-55
  5.4 仿真结果分析  55-57
  5.5 本章小结  57-59
6 总结与展望  59-61
  6.1 本文总结  59-60
  6.2 未来工作展望  60-61
参考文献  61-65
作者简历及在学习期间取得的科研成果  65

相似论文

  1. 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
  2. 基于路预测访问的低功耗高速缓存设计研究,TP333
  3. 基于路访问轨迹和路休眠的高速缓存低功耗研究,TP333
  4. CMP中共享L2Cache失效预测算法研究,TP301.6
  5. 新型DSP访存系统研究与设计,TP368.12
  6. 分组交换网仿真技术与算法研究,TN915.09
  7. 基于DSP和FPGA的高分辨率全景图像实时处理系统硬件设计,TP391.41
  8. 矢量空间数据快速符号化研究与实现,P208
  9. 一种软硬结合的预取技术研究,TP302
  10. 嵌入式数据库的缓存优化与实时事务调度,TP311.13
  11. 数据并行协处理器存储系统的研究与实现,TP338.6
  12. Cache Controller的研究和设计,TP332
  13. 弹载固态记录器的总线研究与应用,TJ760
  14. 32位MIPS处理器研究及其软硬件建模,TN47
  15. 页面分配器的研究与实现,TP316
  16. 磁盘阵列高容错模式及重构技术研究,TP333.35
  17. 基于基地址寄存器映射的数据高速缓存设计研究,TP333
  18. 高速缓存参数无关DNA短序列精确比对算法,Q523
  19. 体系结构级Cache功耗优化技术研究,TP332
  20. 多核处理器中CACHE一致性协议研究和实现,TP332

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程
© 2012 www.xueweilunwen.com