学位论文 > 优秀研究生学位论文题录展示
面向小容量指令缓存的软件优化技术
作 者: 陈辰
导 师: 罗小华; 黄凯
学 校: 浙江大学
专 业: 电气工程
关键词: 高速缓存 优化的缓存块着色算法 过程排序 缓存锁定 选择性不缓存
分类号: TP311.5
类 型: 硕士论文
年 份: 2014年
下 载: 1次
引 用: 0次
阅 读: 论文下载
内容摘要
随着集成电路制造工艺的和计算机体系结构的不断进步,处理器与存储器之间速度的差距也越来越大,处理器读取指令的速度对处理器性能的发挥产生了极大的影响。因此如何提高处理器指令高速缓存的性能,从而提高处理器性能成为研究的焦点。尤其在低成本的嵌入式处理器中,为了降低成本,通常采用小容量的缓存,此时,指令缓存命中率对性能的影响尤为显著。本文针对小容量缓存缺失的特点,从软件优化的角度,提出了几种指令高速缓存的优化方法。针对原始高速缓存软件优化计算方法复杂、适用性差的特点,提出基于统计分析方法的指令高速缓存的软件优化技术,采用gcov和gprof工具对代码静态分析,能大量减低优化过程中的计算复杂度,针对PH算法、缓存块着色算法没有将缓存大小、程序大小、缓存块大小考虑在内,在子函数大小接近或大于缓存大小时,优化效果不佳的特点,提出了优化的缓存块着色算法,在进行着色排序之前,先判断子函数的大小,将过大的子函数进行拆分。本文提出了“缓存锁定选择排序”公式,用于评估判断选择代码段是否锁定或不缓存,大大简化了选择锁定内容时的计算。实验表明,缓存的软件优化技术能使程序执行时间平均减少8%,缓存命中率平均提高23%,有明显的优化效果。
|
全文目录
致谢 4-5 摘要 5-6 Abstract 6-7 目录 7-10 图目录 10-11 表目录 11-12 1 绪论 12-19 1.1 课题背景 12-14 1.1.1 高速缓存的意义 12-13 1.1.2 高速缓存优化思路 13-14 1.2 研究现状 14-16 1.3 本文工作 16-17 1.3.1 指令缓存优化技术的研究 16-17 1.3.2 GCC编译器中gcov和gprof工具流程分析 17 1.3.3 面向小容量缓存的优化技术实现 17 1.4 论文结构 17-19 2 高速缓存原理概述 19-27 2.1 高速缓存的原理 19-21 2.1.1 缓存命中 20 2.1.2 缓存缺失 20 2.1.3 缓存替换 20-21 2.2 高速缓存的组织形式 21-22 2.3 高速缓存的性能 22-24 2.3.1 高速缓存的性能指标 22 2.3.2 高速缓存容量对性能的影响 22 2.3.3 高速缓存块大小对性能的影响 22-23 2.3.4 相连度对性能的影响 23 2.3.5 写策略对缓存性能的影响 23-24 2.4 高速缓存的常用优化方法介绍 24-26 2.4.1 局部性原理 24-25 2.4.2 指令预取 25-26 2.4.3 关键词优先 26 2.4.4 路预测 26 2.5 本章小结 26-27 3 基于gcov和gprof的统计分析方法 27-38 3.1 基于gcov的代码覆盖率与执行次数统计 27-33 3.1.1 代码覆盖率基本概念 27-28 3.1.2 gcov简介 28 3.1.3 gcvo工作流程 28-30 3.1.4 gcov工作原理 30-32 3.1.5 gcvo优缺点分析 32-33 3.2 基于gprof的代码调用信息统计 33-37 3.2.1 gprof简介 33-34 3.2.2 gprof工作原理 34 3.2.3 gprof工作流程 34-36 3.2.4 gprof优缺点分析 36-37 3.3 本章小结 37-38 4 指令高速缓存优化技术 38-49 4.1 针对小容量缓存优化的过程排序 38-44 4.1.1 PH算法中的过程排序 38-39 4.1.2 缓存块着色算法 39-42 4.1.3 针对小容量缓存的优化 42-44 4.2 基于gcov信息的地址段静态锁定 44-46 4.3 基于gcov信息的代码段选择性不缓存 46-47 4.4 本章小结 47-49 5 优化技术实现 49-59 5.1 仿真平台 49-51 5.1.1 CK803处理器 49-50 5.1.2 缓存命中率统计工具 50-51 5.2 仿真流程 51-52 5.3 优化技术实现 52-55 5.4 仿真结果分析 55-57 5.5 本章小结 57-59 6 总结与展望 59-61 6.1 本文总结 59-60 6.2 未来工作展望 60-61 参考文献 61-65 作者简历及在学习期间取得的科研成果 65
|
相似论文
- 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
- 基于路预测访问的低功耗高速缓存设计研究,TP333
- 基于路访问轨迹和路休眠的高速缓存低功耗研究,TP333
- CMP中共享L2Cache失效预测算法研究,TP301.6
- 新型DSP访存系统研究与设计,TP368.12
- 分组交换网仿真技术与算法研究,TN915.09
- 基于DSP和FPGA的高分辨率全景图像实时处理系统硬件设计,TP391.41
- 矢量空间数据快速符号化研究与实现,P208
- 一种软硬结合的预取技术研究,TP302
- 嵌入式数据库的缓存优化与实时事务调度,TP311.13
- 数据并行协处理器存储系统的研究与实现,TP338.6
- Cache Controller的研究和设计,TP332
- 弹载固态记录器的总线研究与应用,TJ760
- 32位MIPS处理器研究及其软硬件建模,TN47
- 页面分配器的研究与实现,TP316
- 磁盘阵列高容错模式及重构技术研究,TP333.35
- 基于基地址寄存器映射的数据高速缓存设计研究,TP333
- 高速缓存参数无关DNA短序列精确比对算法,Q523
- 体系结构级Cache功耗优化技术研究,TP332
- 多核处理器中CACHE一致性协议研究和实现,TP332
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程
© 2012 www.xueweilunwen.com
|