学位论文 > 优秀研究生学位论文题录展示
多核架构下LLC很少重用块的研究
作 者: 乔福明
导 师: 胡同森;田贤忠
学 校: 浙江工业大学
专 业: 计算机应用技术
关键词: 过滤器 很少重用块 预测器 多核 Cache 最近最少使用
分类号: TP332
类 型: 硕士论文
年 份: 2011年
下 载: 12次
引 用: 0次
阅 读: 论文下载
内容摘要
多核Cache中共享最后一级Cache(Last Level Cache,LLC)已经是一个研究热点。多核体系结构中LLC通常为共享L2 Cache,当被访问的数据块不在L2 Cache中时,将会发生L2缺失,CPU需要花费上百个周期访问主存,其代价是无法忍受的。在LLC替换算法(replacement algorithm)中,LRU替换策略被广泛地应用于芯片多处理器中。基于以前的研究,LRU替换策略仍然存在着一些不足,特别是在当应用程序的工作量大于L2 Cache大小时,LRU替换策略可能表现出相当差的性能,这是因为在L2 Cache中存在着大量的从来没有被访问或者访问次数很少的块。如果我们保留经常访问的块在L2 Cache中,那么L2 Cache的性能将会大大提高。本文中提出一种新的称之为共享很少重用过滤器架构,多核情况下,该共享很少重用过滤器可以过滤出未被访问或者访问次数很少的块,将经常访问的块保留在L2 Cache中,可以保证Cache空间被有效的利用,同时命中率也会提高。共享很少重用过滤器主要由3部分组成:过滤缓冲器,阴影标签和频率预测器。过滤缓冲器主要作用是用来过滤很少重用块以及修改频率预测器错误的预测。为了给Cache块一次命中机会,把这个Cache块放入到过滤缓冲器中,当它下次被访问时就变成了经常访问的块并把它插入到L2 Cache。阴影标签主要作用是当过滤缓冲器替换出一个块时,这个块的标签和重用信息被记录到阴影标签中。频率预测器是用来记录L2 Cache中没有出现的块的最近重用频率。当Cache块发生缺失时,频率预测器将根据缺失块的重用频率历史来预测其重用频率值。本文的实验基于11个多线程测试程序:splash-2测试程序。通过修改多核模拟器代码实现了共享很少重用过滤器,实验表明,对于2M LRU管理的且拥有一个256K大小的共享重用过滤器的L2 Cache,与单核情况相比较其IPC可以平均提高13.43%,MPKI可以平均减少18.20%。
|
全文目录
摘要 5-6 ABSTRACT 6-10 第1章 绪 论 10-16 1.1 课题背景 10-12 1.2 研究动机 12-13 1.3 本文主要工作 13-14 1.4 本文的组织结构 14 1.5 本章小结 14-16 第2章 高性能CACHE 设计和性能优化综述 16-23 2.1 CACHE 的技术背景 16-17 2.2 提高直接映射和低关联度CACHE 性能 17-18 2.3 提高L2 CACHE 性能 18-21 2.4 目前研究存在的问题 21 2.5 本章小结 21-23 第3章 共享很少重用过滤器SLRF 的设计 23-36 3.1 多核中的很少重用块 23-26 3.2 共享很少重用过滤器SLRF 的设计 26-32 3.2.1 传统LLC 的结构设计 26-27 3.2.2 共享很少重用过滤器SLRF 的结构 27-32 3.3 共享很少重用过滤器SLRF 的工作原理 32-34 3.4 本章小结 34-36 第4章 实验结果和分析 36-48 4.1 实验方法 36-40 4.1.1 系统配置 36-37 4.1.2 测试程序集 37-38 4.1.3 模拟器介绍 38-40 4.2 共享很少重用过滤器SLRF 实验结果和分析 40-46 4.2.1 共享很少重用过滤器的特征 40-42 4.2.2 缺失率的影响 42-43 4.2.3 系统性能的影响 43-44 4.2.4 总体命中率 44-45 4.2.5 过滤缓冲器的大小对MPKI 的影响 45-46 4.2.6 开销代价 46 4.3 本章小结 46-48 第5章 总结和展望 48-50 5.1 总结 48-49 5.2 展望 49-50 参考文献 50-56 附录 56-60 致谢 60-61 攻读位期间参加的科研项目和成果 61
|
相似论文
- 多核系统下并行节点复制垃圾收集算法研究,TP332
- 基于多核网络处理器的IPv6联动IPS研究与设计,TP393.04
- 含锆Keggin型多金属氧酸盐衍生物的合成、结构与性质,O611.3
- 数字图像中文字移除和修复系统的设计和实现,TP391.41
- 电离辐射和紫杉醇诱导的多核细胞形成中SPATA5L1、Cyclin B2表达的变化,R739.8
- 高等级生物安全实验室排风险检漏系统的研制,Q-33
- 高效空气过滤器性能及其测试系统研究,TU834.83
- 基于多核的数据并行编程平台的研究与实现,TP332
- 基于多视角的分类器设计与权值优化方法研究,TP18
- 基于多核学习的高性能核分类方法研究,TP391.41
- 面向存储器完整性验证的Cache设计,TP332
- 基于转导推理思想的一致性预测器,TP181
- 多核集群环境下并行地理计算执行时间预测技术研究,TP338.6
- 高性能微处理器RTL级和体系结构级低功耗设计关键技术研究,TP332
- 多核平台IDS性能分析与报文分流方法研究,TP393.08
- YHFT-Matrix DSP取指部件设计实现与多指令流扩展,TP368.1
- 宇航处理器Cache系统的可靠性分析和加固研究,V443
- Cache敏感的空间连接算法研究与实现,TP332
- 虚拟机环境下动态Cache划分技术研究与实现,TP332
- “银河飞腾-DX”DSP高效二级cache的设计与实现,TP332
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com
|