学位论文 > 优秀研究生学位论文题录展示

“银河飞腾-DX”DSP高效二级cache的设计与实现

作 者: 靳强
导 师: 郭阳
学 校: 国防科学技术大学
专 业: 电子科学与技术
关键词: DSP cache 缺失流水线 步长自适应 预取 信心系统机制
分类号: TP332
类 型: 硕士论文
年 份: 2011年
下 载: 36次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,数字信号处理器(DSP)得到越来越广泛的应用,但DSP性能的提升同样面临“存储墙”问题带来的设计瓶颈,解决这个问题的重要途径就是设置多级存储结构。在当今DSP设计中,“cache+RAM”的二级存储体系结构已成为片内存储结构的主要选择,它不仅担任片内存储器的职责,同时还负责DSP核与外存之间的通信任务。因此,如何设计一种高效的“cache+RAM”片内二级存储结构,特别是一种高效的二级cache工作机制,是DSP设计中的一个关键问题。“银河飞腾-DX”DSP是我院自主研发的高性能定点DSP,采用超长指令字结构(VLIW),每个取值包由8条指令组成,最多可在一拍内完成8条指令的分配与执行。采用片内二级存储体系结构,二级存储器为总容量为1MB的共享“cache+RAM”的可配置结构,用户可根据实际应用程序的需要灵活调整二级存储器中cache和RAM的比例。本文围绕高效二级cache的设计实现进行研究,主要包括以下几方面工作。首先,分析了一般的Cache的设计方法,全面考察了主流DSP芯片中cache的性能要求和实现技术,设计实现了“银河飞腾-DX”DSP中L2 cache的缺失流水线结构。L2 cache的缺失流水线能够流水地处理L1的缺失请求,能够有效隐藏L1缺失请求在L2 cache中的命中时间,在“银河飞腾-DX”DSP平台上的RTL级模拟测试表明,L2 cache缺失流水线对处理访问L2存储器的缺失请求最多可达到1.31的加速比。其次,分析了实际应用程序对于cache的访存行为,总结出两种可以进行预测的访存失效地址序列类型,并针对这两种访存失效地址序列类型设计了一种步长自适应二级cache预取机制。该机制针对二级cache的工作特点,使用访存失效地址的cache块地址作为查询预取表的索引,简化了在cache基础上设计添加预取结构的硬件实现。同时,预取机制引入信心系统机制,能够有效地降低cache的失效率。对SPEC2006测试程序的运行结果表明,步长自适应二级cache预取机制对程序访存的失效率最多可降低4.5%,对程序的加速比最大可达1.3。最后,结合L2 cache缺失流水线结构和步长自适应二级cache预取机制,在“银河飞腾-DX“DSP平台上设计了带有预取结构的L2 cache缺失流水线。该结构综合了缺失流水线和步长自适应二级cache预取机制的优势,能够进一步提升“银河飞腾-DX”DSP的系统访存性能。

全文目录


相似论文

  1. 电子提花编织机电控系统设计,TS183
  2. 基于DSP的集成光栅细分数显装置的研制,TH822
  3. 基于DSP的二维准直系统的研究,TH741.14
  4. 半实物火炮自动操瞄俯仰角度控制系统的研究,TJ303
  5. 同步电动机励磁控制系统研究,TM341
  6. 基于DSP的任意次谐波发生器的设计,TM935
  7. AES算法及其DSP实现,TN918.1
  8. 基于DSP的机器人语音命令识别系统研制,TN912.34
  9. 相位法激光测距仪信号接收系统研究,TN249
  10. 基于DSP的OFDM系统中的信道估计技术实现研究,TN919.3
  11. 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
  12. 基于DSP的VXI总线通用接口板研制,TP274
  13. 基于双DSP的三相四线制有源电力滤波器的研究,TN713.8
  14. 基于DSP的永磁同步电机控制系统的设计与实现,TM341
  15. 太阳能光伏并网发电系统的研究,TM615
  16. 基于DSP的水稻杂草识别研究,TP391.41
  17. 动态无功补偿装置设计及其并网混沌现象分析,TM761
  18. 多核架构下LLC很少重用块的研究,TP332
  19. 基于有源箝位正激磁集成变换器无源控制的研究,TM46
  20. 大型风力机电动变桨距控制技术研究,TM315
  21. 时空结合的数据预取,TP333

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com