学位论文 > 优秀研究生学位论文题录展示
“银河飞腾-DX”DSP高效二级cache的设计与实现
作 者: 靳强
导 师: 郭阳
学 校: 国防科学技术大学
专 业: 电子科学与技术
关键词: DSP cache 缺失流水线 步长自适应 预取 信心系统机制
分类号: TP332
类 型: 硕士论文
年 份: 2011年
下 载: 36次
引 用: 0次
阅 读: 论文下载
内容摘要
近年来,数字信号处理器(DSP)得到越来越广泛的应用,但DSP性能的提升同样面临“存储墙”问题带来的设计瓶颈,解决这个问题的重要途径就是设置多级存储结构。在当今DSP设计中,“cache+RAM”的二级存储体系结构已成为片内存储结构的主要选择,它不仅担任片内存储器的职责,同时还负责DSP核与外存之间的通信任务。因此,如何设计一种高效的“cache+RAM”片内二级存储结构,特别是一种高效的二级cache工作机制,是DSP设计中的一个关键问题。“银河飞腾-DX”DSP是我院自主研发的高性能定点DSP,采用超长指令字结构(VLIW),每个取值包由8条指令组成,最多可在一拍内完成8条指令的分配与执行。采用片内二级存储体系结构,二级存储器为总容量为1MB的共享“cache+RAM”的可配置结构,用户可根据实际应用程序的需要灵活调整二级存储器中cache和RAM的比例。本文围绕高效二级cache的设计实现进行研究,主要包括以下几方面工作。首先,分析了一般的Cache的设计方法,全面考察了主流DSP芯片中cache的性能要求和实现技术,设计实现了“银河飞腾-DX”DSP中L2 cache的缺失流水线结构。L2 cache的缺失流水线能够流水地处理L1的缺失请求,能够有效隐藏L1缺失请求在L2 cache中的命中时间,在“银河飞腾-DX”DSP平台上的RTL级模拟测试表明,L2 cache缺失流水线对处理访问L2存储器的缺失请求最多可达到1.31的加速比。其次,分析了实际应用程序对于cache的访存行为,总结出两种可以进行预测的访存失效地址序列类型,并针对这两种访存失效地址序列类型设计了一种步长自适应二级cache预取机制。该机制针对二级cache的工作特点,使用访存失效地址的cache块地址作为查询预取表的索引,简化了在cache基础上设计添加预取结构的硬件实现。同时,预取机制引入信心系统机制,能够有效地降低cache的失效率。对SPEC2006测试程序的运行结果表明,步长自适应二级cache预取机制对程序访存的失效率最多可降低4.5%,对程序的加速比最大可达1.3。最后,结合L2 cache缺失流水线结构和步长自适应二级cache预取机制,在“银河飞腾-DX“DSP平台上设计了带有预取结构的L2 cache缺失流水线。该结构综合了缺失流水线和步长自适应二级cache预取机制的优势,能够进一步提升“银河飞腾-DX”DSP的系统访存性能。
|
全文目录
相似论文
- 电子提花编织机电控系统设计,TS183
- 基于DSP的集成光栅细分数显装置的研制,TH822
- 基于DSP的二维准直系统的研究,TH741.14
- 半实物火炮自动操瞄俯仰角度控制系统的研究,TJ303
- 同步电动机励磁控制系统研究,TM341
- 基于DSP的任意次谐波发生器的设计,TM935
- AES算法及其DSP实现,TN918.1
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 相位法激光测距仪信号接收系统研究,TN249
- 基于DSP的OFDM系统中的信道估计技术实现研究,TN919.3
- 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
- 基于DSP的VXI总线通用接口板研制,TP274
- 基于双DSP的三相四线制有源电力滤波器的研究,TN713.8
- 基于DSP的永磁同步电机控制系统的设计与实现,TM341
- 太阳能光伏并网发电系统的研究,TM615
- 基于DSP的水稻杂草识别研究,TP391.41
- 动态无功补偿装置设计及其并网混沌现象分析,TM761
- 多核架构下LLC很少重用块的研究,TP332
- 基于有源箝位正激磁集成变换器无源控制的研究,TM46
- 大型风力机电动变桨距控制技术研究,TM315
- 时空结合的数据预取,TP333
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com
|