学位论文 > 优秀研究生学位论文题录展示

YHFT-DX一级Cache控制器的设计优化与系统级验证方法研究

作 者: 杨唤荣
导 师: 孙永节
学 校: 国防科学技术大学
专 业: 软件工程
关键词: 数字信号处理器 Cache 时序优化 低功耗 逻辑综合 模拟验证
分类号: TP332
类 型: 硕士论文
年 份: 2010年
下 载: 39次
引 用: 1次
阅 读: 论文下载
 

内容摘要


YHFT-DX是一款基于超长指令字的高性能定点数字信号处理器,内核的设计目标要达到主频600MHz,峰值速度4800MIPS。为了解决存储墙问题,片内缓存采用了“两级Cache+RAM”的层次化存储结构,片内总线采用增强型的哈佛体系结构,其一级Cache(L1)分为一级指令Cache和一级数据Cache,工作频率跟CPU保持一致。论文主要涉及两个方面工作,一是根据YHFT-DX芯片的设计要求,主要采用半定制设计的方法,完成了L1控制器的设计优化、验证和综合,版图后的PrimeTime静态时序分析的结果表明最长路径延时为1.61ns,达到了600MHz的设计目标;二是完成芯片系统级模拟验证工作。针对验证目标提出并实现了基于内存监视的验证方法,大大提高了验证效率。本文的研究和工程工作主要体现在以下几个方面:1、在结构算法级、代码级、电路级、布局方面采用了多种优化策略,对L1控制器进行了时序优化,优化后一级指令和数据Cache的延时分别减少29.7%和22.2%。2、采用存储体分体控制、门控时钟、双阈值技术对L1进行了低功耗设计,实验结果表明一级指令Cache的动态功耗降低30.2%,漏流功耗降低74%,面积减小4%,一级数据Cache的动态功耗降低33.6%,漏流功耗降低54.3%,面积减小5.8%。3、完成了L1的逻辑综合以及验证工作。通过在验证环境中添加断言,并采取功能覆盖的方法有针对性的手工开发测试向量,完成了模块和部件级的验证。在此基础上移植了一些经典的DSP算法和大型测试程序,通过大量的模拟,保证了设计的正确性。4、针对YHFT-DX的验证环境,提出并实现了基于内存监视的协同模拟验证方法,在YHFT-DX全芯片的功能验证中使用这种验证方法,有效的提高了验证的效率和质量。

全文目录


摘要  10-11
ABSTRACT  11-12
第一章 绪论  12-16
  1.1 课题研究背景  12-13
  1.2 相关研究工作  13-14
    1.2.1 Cache 相关技术研究  13
    1.2.2 微处理器验证技术研究  13-14
  1.3 课题完成的主要工作  14
  1.4 论文的组织结构  14-16
第二章 YHFT-DX 一级Cache 概要设计和优化策略  16-24
  2.1 功能概述和整体结构  16-17
  2.2 YHFT-DX 一级Cache 结构介绍  17-20
    2.2.1 一级指令Cache 结构  17-18
    2.2.2 一级数据Cache 结构  18-20
  2.3 设计存在的问题分析  20-21
  2.4 优化策略  21-24
    2.4.1 时序优化的基本策略  21-23
    2.4.2 功耗优化的基本策略  23-24
第三章 L1 的结构和时序优化  24-42
  3.1 存储体的划分与分体控制  24-27
    3.1.1 一级数据Cache 存储体的纵向划分  24-26
    3.1.2 一级指令Cache 存储体的横向划分  26-27
  3.2 逻辑结构和算法的优化  27-33
    3.2.1 去除冗余逻辑  27-29
    3.2.2 关键操作提前处理  29-30
    3.2.3 串行路径并行处理  30-31
    3.2.4 信号的等价替换  31-33
  3.3 代码级的优化  33-38
    3.3.1 添加流水站  33-34
    3.3.2 平衡流水站  34-36
    3.3.3 代码结构的等价性调整  36-37
    3.3.4 逻辑复制与高扇出结点的处理  37-38
  3.4 电路级的优化  38-39
    3.4.1 部分定制  38-39
    3.4.2 单元替换  39
  3.5 布局优化  39-41
  3.6 优化结果  41-42
第四章 L1 的逻辑综合与功耗优化  42-53
  4.1 选择合适的综合策略  42-43
  4.2 设置综合约束  43-45
    4.2.1 环境约束  43-44
    4.2.2 设计规则约束  44
    4.2.3 优化约束  44-45
    4.2.4 其他约束  45
  4.3 利用综合工具插入门控时钟  45-49
    4.3.1 全局的动态时钟管理  46-47
    4.3.2 局部的门控时钟插入  47-49
    4.3.3 优化结果  49
  4.4 双阈值技术  49-51
    4.4.1 双阈值的低功耗实现  49-50
    4.4.2 优化结果  50-51
  4.5 线负载模型反标注  51
  4.6 综合结果  51-52
  4.7 本章小结  52-53
第五章 L1 的功能验证和时序验证  53-61
  5.1 验证的一般方法  53
  5.2 YHFT-DX 一级Cache 模拟验证方案  53-59
    5.2.1 YHFT-DX 模拟验证环境  53-54
    5.2.2 一级数据Cache 部件级验证  54-57
    5.2.3 一级指令Cache 部件级验证  57-58
    5.2.4 大型测试程序验证  58-59
  5.3 时序验证  59-60
  5.4 本章小结  60-61
第六章 系统级验证方法研究  61-70
  6.1 传统验证方法的缺陷  61
  6.2 基于内存监视的协同模拟验证  61-67
    6.2.1 基本原理  61-63
    6.2.2 软件模拟器执行过程“拍照”  63-64
    6.2.3 RTL 模型的“拍照”  64-65
    6.2.4 离线模式下的相片匹配  65-66
    6.2.5 “拍照”的频率  66-67
  6.3 YHFT-DX 系统级验证流程  67-69
  6.4 本章小结  69-70
第七章 结束语  70-71
致谢  71-72
参考文献  72-74
本人在学期间取得的学术成果  74

相似论文

  1. WCDMA终端测试仪中低功耗、低杂散频率合成器的研究与设计,TN74
  2. 基于DSP的永磁同步交流伺服电机控制系统研究,TM383.42
  3. 多功能无线鼠标的研究与设计,TP334.2
  4. 低压低功耗CMOS模拟乘法器研究与设计,TN432
  5. 低损耗有源电力滤波器控制器设计,TN713.8
  6. 嵌入式手持移动设备上地理信息展示的低功耗实现,TP311.52
  7. 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
  8. 基于65nm工艺的高性能音频∑△模数转换器的研究与实现,TN792
  9. HART无线适配器的研究与设计,TN915.05
  10. 低功耗、多主接口、多图层的液晶控制器设计,TN873.93
  11. 自适应OFDM数字基带接收器的低功耗研究,TN851
  12. 基于IPv6的无线传感器网络的移动性管理技术研究,TP212.9
  13. 面向存储器完整性验证的Cache设计,TP332
  14. 基于路预测访问的低功耗高速缓存设计研究,TP333
  15. 自主水下航行器组合导航算法研究与系统实现,U666.1
  16. 基于嵌入式Linux系统的低功耗方案的设计与实现,TP368.1
  17. 基于DSP和CPLD的运动控制卡设计与实现,TP273
  18. 无源RFID标签芯片的低功耗电源管理系统,TN402
  19. 基于DM6467 DSP处理器的多通道H.264视频编码软件设计,TN919.81
  20. 永磁直线电动机磁悬浮系统鲁棒控制策略研究,TM359.4
  21. 面向异构数据的低功耗传感器网络中TDMA协议的设计与实现,TP212.9

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com