学位论文 > 优秀研究生学位论文题录展示

32位高性能嵌入式CPU及平台研发

作 者: 葛海通
导 师: 严晓浪
学 校: 浙江大学
专 业: 电路与系统
关键词: 嵌入式CPU SoC设计平台 多媒体增强 单指令多数据流 存储器管理 等价性验证
分类号: TP332
类 型: 博士论文
年 份: 2009年
下 载: 396次
引 用: 1次
阅 读: 论文下载
 

内容摘要


嵌入式CPU作为SoC设计中最重要最关键的IP,其研发受到了广泛关注。本文主要围绕CKCORE国产32位嵌入式CPU的研制,对其体系结构、核心模块、验证流程,以及SoC平台等多项关键技术进行了深入研究。本文自主设计了32位嵌入式CPU的微体系结构,解决了乱序执行和快速退休、分支预测、写缓存、CPU硬核化等核心技术,实现了高性能低功耗的CK510。本文进一步研究了基于超标量体系的CK610,提出了投机执行、非阻塞指令发射和数据访问、硬件保留栈,以及动态可配置的CACHE回写等关键技术,大幅提升了性能。CK510/CK610按行业标准实现了硬核化,其主要技术指标与国际同档嵌入式CPU相当。针对多媒体增强单元设计,本文提出了宏单元分段共享的SIMD运算框架,通过基本乘法和加法逐层构建不同宽度的SIMD运算单元,有效解决了传统方法部分积过多,控制复杂和进位链延时大的缺点。设计了DSP扩展单元,提出了运算延时量化的流水线划分、全流水执行与结果回写、非阻塞发射与乱序执行,以及指令提前退休和延迟回写等多项关键技术,有效提升了多媒体应用性能。针对内存管理单元设计,本文提出一种基于全综合设计流程的分组匹配TLB方法,设计了全流水的TLB存储单元访问机制和初始地址预测,加速了TLB表项查询速度。高性能低功耗两级TLB访问机制,实现了访问速度与访问容量的优势互补。本文同时提出了软件透明的动态页面合并技术,提高了uTLB表项的地址转换效率。针对CPU的设计验证,本文重点研究了一种新的等价性验证流程及其验证系统ZDFV。ZDFV的核心由面向RTL级验证工具、面向门级验证工具,以及面向验证的综合工具组成。在对各种验证引擎深入研究的基础上,ZDFV提出了无依赖性割集和量化、锁存器匹配、混合SAT等多种验证方法,有效提升了处理器的验证效率。本文设计了基于自主CPU的SoC开发平台。平台以SPIRIT标准规范IP的特征,以XML标准描述目标SoC,可快速灵活的兼容任意遵从AMBA协议的功能模块,自动完成IP集成。在给定体系架构和约束的情况下,平台可自动生成RTL及FPGA仿真验证平台,支持软硬件协同设计,从而确保系统集成的正确和高效。

全文目录


致谢  5-6
摘要  6-7
Abstract  7-14
第1章 绪论  14-33
  1.1 研究背景与意义  14-15
  1.2 CPU设计技术的发展  15-26
  1.3 嵌入式CPU与SoC设计  26-30
  1.4 论文的主要研究内容和贡献  30-31
  1.5 论文的组织结构  31-33
第2章 国际主流嵌入式CPU系列  33-52
  2.1 美国MIPS公司的嵌入式CPU  33-36
  2.2 英国ARM公司的嵌入式CPU  36-39
  2.3 美国ARC公司的可配置CPU  39-42
  2.4 美国Tensilica公司的可重构嵌入式CPU  42-46
  2.5 海内外的其他嵌入式CPU  46-48
  2.6 嵌入式CPU的技术趋势总结  48-52
第3章 CKCORE嵌入式CPU设计  52-79
  3.1 CKCORE CPU简介  52-54
  3.2 CK500系列CPU的微结构设计  54-63
  3.3 CK500的硬核和性能  63-69
  3.4 CK600系列CPU设计  69-73
  3.5 CK600的硬核与性能  73-77
  3.6 本章小结  77-79
第4章 嵌入式CPU多媒体增强单元设计研究  79-101
  4.1 基于乘法分解的SIMD架构研究  80-87
  4.2 CKCORE多媒体增强单元设计研究  87-98
  4.3 性能对比  98-100
  4.4 本章小结  100-101
第5章 基于全综合的两级TLB关键技术研究  101-117
  5.1 基于全综合的分组匹配TLB访问机制研究  102-108
  5.2 高性能低功耗两级TLB访问机制设计研究  108-112
  5.3 基于牺牲uTLB的页面合并方法研究  112-115
  5.4 本章小结  115-117
第6章 面向嵌入式CPU设计的等价性验证方法  117-130
  6.1 ZDFV等价性验证系统  117-119
  6.2 基于门级电路等价性验证方法  119-125
  6.3 基于混合SAT的RTL级等价性验证  125-127
  6.4 面向等价性验证的RTL综合工具  127-129
  6.5 本章小结  129-130
第7章 基于CKCORE的SoC设计平台  130-153
  7.1 SoC平台的组成和特性  130-132
  7.2 基于CKCORE的CKSoC平台  132-148
  7.3 面向无线音频应用的SoC芯片实例  148-152
  7.4 本章小结  152-153
第8章 总结与展望  153-157
  8.1 论文研究工作总结  153-155
  8.2 今后的工作展望与思考  155-157
参考文献  157-168
攻读学位期间取得的科研成果  168-170

相似论文

  1. 基于NIOSⅡ的PLC系统,TP273
  2. 一种面向无线应用的音频编解码算法的实现和优化,TN912.3
  3. 应用于集成电路形式化验证的SAT算法研究,TN402
  4. 基于BDD的逻辑电路验证,TN791
  5. 基于CKA5102平台的G.729A语音编解码算法优化与实现,TN912.3
  6. 蓝牙芯片的综合实现与验证,TN492
  7. 面向语音编解码算法的高性能SOC架构的研究,TP332
  8. 基于DM642的AVS视频编码优化及其实现,TN919.81
  9. 半定制/全定制混合设计流程中验证方法研究,TN407
  10. 1750A存储器管理与保护,TP333.1
  11. 数字交换机辅存及同步时钟系统,TN916.428
  12. 视频编码标准H.264及其快速实现算法研究,TN919.81
  13. 可扩展多堆动态存储器管理解决方案,TP333
  14. 单兵信息系统的硬件设计,E962
  15. 满足性算法在形式化验证中的应用研究及实现,TP301.6
  16. 基于逻辑锥和SAT的带黑盒电路等价性验证方法,TN431.2
  17. 集成电路等价性验证系统设计及其实现,TN402
  18. 嵌入式CPU存储器管理的实现,TP332
  19. 图像增强与复原方法在X射线图像处理中的应用,R318
  20. 专用密码芯片系统集成设计与实现研究,TN402
  21. 页面分配器的研究与实现,TP316

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com