学位论文 > 优秀研究生学位论文题录展示

多核处理器中最后一级共享高速缓存管理策略研究

作 者: 尹巍
导 师: 吴俊敏
学 校: 中国科学技术大学
专 业: 计算机系统结构
关键词: 多核处理器 最后一级高速缓存 LRU策略 访存行为 预测访问间隔 高速缓存缺失 主存储器访问 高速缓存管理策略
分类号: TP332
类 型: 硕士论文
年 份: 2011年
下 载: 80次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着高性能处理器技术的发展,存储墙问题为影响处理器系统性能的主要因素之一。处理器速度通常会比存储器的访问速度快两个数量级,当代多核处理器广泛采用基于大容量最后一级共享高速缓存的结构来缩小这一差距。但是适用于小容量私有高速缓存的传统管理策略并不适用于管理大容量最后一级共享高速缓存,它可能引起高速缓存缺失数的增加,触发大量代价昂贵的片外存储器访问。其原因主要有以下两点:首先,小容量私有高速缓存主要强调访问速度,而最后一级高速缓存则强调尽可能多地将数据保留在片内,它更多地受制于片内可用晶体管数量而对访问速度的要求不高。其次,这两种不同类型的高速缓存可见的数据访问流局部性差别非常大。因此,一种能够有效管理大容量最后一级共享高速缓存的管理策略对于当今高性能微处理器而言,显得非常重要。本文重点分析了多核平台下大容量共享最后一级高速缓存管理过程中存在的一些热点研究问题,并提出相应代价较小但是收效较大的解决方案以提高系统性能。本文的主要研究内容与贡献包括:1.消除低重用块和预测访问间隔策略研究。传统的LRU策略严重制约了大容量共享最后一级高速缓存的性能,解决这一问题的方法之一就是优先淘汰低重用数据块以缩小工作集,使得使用频率较高的数据留在片内,以获得较高的命中率提高性能。本文设计了一种被称之为低重用块消除和重新访问间隔预测管理策略。根据最后一级高速缓存中低重用块占用资源时间较长这一特点,该策略通过感知最后一级高速缓存的上一级高速缓存的数据历史访问信息预测出低重用块并将其优先淘汰;并且通过改进的访问间隔预测技术预测出潜在的低重用块并将其优先淘汰。实验表明,对于4核多核处理器而言,TADELRRIP可以将加权加速比平均提高9.14%.2.分治感知管理策略研究。由于不同负载在不同执行时期存在不同访存行为,单一高速缓存管理策略已经无法满足不同局部特性负载的性能需求。当并发执行的线程间存在破坏性干扰时,最后一级高速缓存可能会产生大量的缺失,从而引起多核处理器系统整体性能的下降。本文提出了分治感知管理策略(TADC),该策略将高速缓存组内的资源均分给各个工作负载,各个负载在所分得的资源内管理自己的数据块。在不同的执行时期内,TADC能感知不同负载的不同访存行为,并对它们采取不同的管理策略。实验表明,TADC可以将2核处理器和4核处理器的性能可以分别平均提高7.48%和3.00%。

全文目录


摘要  4-5
ABSTRACT  5-10
第1章 绪论  10-16
  1.1 本文的研究背景  10-13
    1.1.1 微处理器的发展趋势  10-11
    1.1.2 多核高速缓存设计所面临的挑战  11-12
    1.1.3 当前主流的高速缓存管理技术  12-13
  1.2 本文的主要贡献  13-15
  1.3 本文的组织结构  15-16
第2 章高速缓存管理策略研究背景  16-26
  2.1 高速缓存的介绍  16-17
  2.2 高速缓存的设计架构  17-19
    2.2.1 高速缓存层次设计结构  17
    2.2.2 二级高速缓存的设计方案  17-19
  2.3 高速缓存管理策略研究现状  19-21
  2.4 高速缓存性能优化  21-24
    2.4.1 降低高速缓存中的冲突性缺失  22
    2.4.2 增加高速缓存的容量利用率  22-23
    2.4.3 减少多核处理器中的一致性缺失  23-24
  2.5 本章小结  24-26
第3章 消除低重用块和预测访问间隔的Cache 管理策略  26-40
  3.1 引言  26-27
  3.2 背景  27-28
  3.3 低效用块消除和访问间隔预测Cache 管理策略  28-34
    3.3.1 ELRRIP 硬件结构  28-29
    3.3.2 静态ELRRIP 策略(SELRRIP)  29
    3.3.3 上一级Cache 低重用块感知  29
    3.3.4 数据插入策略  29
    3.3.5 数据提升策略  29
    3.3.6 淘汰策略  29-31
    3.3.7 SELRRIP 的运行实例  31-33
    3.3.8 动态ELRRIP 策略(DELRRIP)  33-34
  3.4 性能评价方法以及评价指标  34-35
    3.4.1 性能评价方法  34-35
    3.4.2 性能评价指标  35
  3.5 试验结果及分析  35-39
    3.5.1 性能加速比  35-38
    3.5.2 对Cache 容量的敏感度分析  38-39
    3.5.3 硬件开销分析  39
  3.6 结论  39-40
第4 章分治线程感知Cache 管理策略  40-52
  4.1 引言  40-41
  4.2 背景  41-43
    4.2.1 多核平台下的负载行为特性  41-42
    4.2.2 高速缓存管理策略  42-43
  4.3 分治线程感知Cache 管理策略  43-46
    4.3.1 分治策略框架  43-44
    4.3.2 负载类型感知算法  44
    4.3.3 负载管理策略选择  44-45
    4.3.4 TADC 运行实例  45-46
  4.4 实验方法  46-47
  4.5 实验结果及其分析  47-50
    4.5.1 阀值分析  47-48
    4.5.2 吞吐量分析  48-49
    4.5.3 可扩放性分析  49
    4.5.4 硬件开销  49-50
  4.6 本章小结  50-52
第5章 全文总结及未来展望  52-56
  5.1 全文总结  52-53
  5.2 未来工作展望  53-56
参考文献  56-62
致谢  62-64
在读期间发表的学术论文与取得的研究成果  64-66
在读期间参与的科研项目  66

相似论文

  1. TD-SCDMA无线链路控制协议实现研究,TN929.533
  2. 多核系统中基于温度限制的节能调度算法研究,TP332
  3. 分布式内存多核处理器流程序虚拟机研究,TP333.1
  4. 基于TILE Pro64多核处理器的3G服务器视频转码软件设计,TP393.05
  5. 基于TilePro64多核处理器的H.264高清视频解码软件设计,TN919.81
  6. 基于GALS的多核互连及任务调度策略研究,TN47
  7. 基于共享前端的流多核体系结构关键技术研究,TP332
  8. 基于群智能和冲突规避策略的基因—基因交互作用检测及其并行计算,TP391.41
  9. 多分辨率图像锥结合FCM的多核并行图像分割算法研究,TP391.41
  10. 高性能低功耗多核处理器研究,TP332
  11. DTMB中3780点FFT在多核DSP平台上的实现,TP368.1
  12. 面向软件事务存储的内存管理技术研究与实现,TP333.1
  13. 面向MPI程序的进程数据相似性分析与优化技术,TP311.11
  14. 基于页着色技术的多核实时系统中Cache共享策略的研究,TP332
  15. 基于NiosⅡ的同构多核处理器设计与FPGA实现,TP332
  16. 基于多核处理器的分组数据通信网关系统设计与实现,TN919.2
  17. 基于同构多核处理器的H.264并行解码算法研究,TN919.81
  18. 面向图像处理的异构多核仿真系统研究,TP391.41
  19. 基于异构多核处理器系统的任务调度算法研究,TP301.6
  20. 磁共振稀疏重建算法与直接离散傅里叶变换重建算法并行处理加速方法的研究,TP391.41
  21. 基于SOPC的多核处理器互连技术的研究,TP332

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com