学位论文 > 优秀研究生学位论文题录展示
嵌入式处理器中Cache的研究与设计
作 者: 姜难难
导 师: 喻明艳
学 校: 哈尔滨工业大学
专 业: 微电子学与固体电子学
关键词: Cache RAM-Tag 设计空间 CAM-Tag
分类号: TP332
类 型: 硕士论文
年 份: 2009年
下 载: 120次
引 用: 1次
阅 读: 论文下载
内容摘要
随着微处理器设计技术的不断发展,Cache得到了广泛应用,以解决处理器与主存之间性能差距越来越大的难题。但由于Cache在处理器设计中的比重较大,其性能和功耗对处理器的性能和功耗会产生巨大影响,因此Cache优化设计显得至关重要。为了得到较为精确的实验数据,本文基于RTL级模拟平台对Cache结构进行研究。由于在该平台上运行整个标准程序的代价太大,本文基于M5搭建了软件模拟平台。根据标准程序的周期特性,在软件模拟平台上通过BBTraker提取其基本块信息,并利用SimPoint提取模拟点。在RTL级平台上运用上述结果,并根据Early SimPoint算法截断运行标准程序。在保证数据精确性的前提下大大缩短了程序在RTL平台上的运行时间。本课题基于单发射按序执行处理器设计了RAM-Tag Cache,通过在RTL级模拟平台上运行SPEC2000标准程序,结合NC_verilog, Design compiler和Powercompiler工具,研究Cache结构参数对性能和功耗的影响,给出了较为精确的缺失率和功耗随结构参数变化的设计空间,并在此基础上确定了最优的Cache结构(容量为16K,line大小为32Byte,32路组相联)。此外本文还对Round Robin和伪LRU替换算法进行研究,并根据实验结果将前者应用于指令Cache,将后者应用于数据Cache。此外,CAM的快速索引可以使高相联度Cache的能耗得到很大程度的改善,因此,本课题利用设计空间探索过程中所确立的最优Cache结构,设计了CAM-Tag Cache。实验结果表明,与基于RAM-Tag Cache相比,其指令Cache和数据Cache的平均能耗分别降低了35.16%和30.68%。
|
全文目录
摘要 4-5 Abstract 5-8 第1章 绪论 8-13 1.1 研究背景 8-9 1.2 国内外研究现状 9-11 1.3 研究内容及意义 11-12 1.4 论文结构 12-13 第2章 Cache 概述 13-20 2.1 基本工作原理 13 2.2 Cache 的含义 13-14 2.3 工作原理 14-15 2.3.1 读过程 14 2.3.2 写过程 14-15 2.4 组织形式 15-16 2.5 替换策略 16-17 2.6 功耗模型 17 2.7 基本结构 17-19 2.7.1 联合与分离结构 18 2.7.2 Cache 结构参数 18-19 2.7.3 Cache 存储体 19 2.8 本章小结 19-20 第3章 模拟平台 20-32 3.1 软件模拟平台 20-25 3.1.1 模拟平台概述 20-22 3.1.2 搭建模拟平台 22-25 3.2 标准程序的研究 25-28 3.2.1 研究方法 26 3.2.2 模拟点的提取 26-28 3.3 RTL 级模拟平台 28-31 3.3.1 基础处理器 29-30 3.3.2 RTL 级模拟平台 30-31 3.4 本章小结 31-32 第4章 Cache 设计空间探索 32-49 4.1 基础Cache 设计 32-37 4.1.1 存储体的设计 32-33 4.1.2 存储操作 33-36 4.1.3 控制器的设计 36-37 4.2 Cache 性能研究 37-40 4.2.1 相联度对性能的影响 38-39 4.2.2 容量对性能的影响 39-40 4.2.3 Line 大小对性能的影响 40 4.3 Cache 功耗研究 40-42 4.3.1 相联度对功耗的影响 41-42 4.3.2 容量和line 大小对功耗的影响 42 4.4 Cache 替换算法的研究 42-45 4.4.1 替换算法的实现 43-44 4.4.2 替换算法对性能的影响 44-45 4.4.3 替换算法的硬件消耗 45 4.5 Cache 结构的确立 45-46 4.6 CAM-Tag Cache 设计 46-48 4.6.1 CAM 简介 46-47 4.6.2 CAM-Tag Cache 结构 47-48 4.6.3 CAM-Tag Cache 功耗研究 48 4.7 本章小结 48-49 结论 49-50 参考文献 50-55 攻读学位期间发表的学术论文 55-57 致谢 57
|
相似论文
- 科技博物馆建筑设计研究,TU242.5
- 外观设计专利侵权对比判定研究,D923.42
- 室内纺织品设计在室内空间的配套应用,TS105.1
- 面向存储器完整性验证的Cache设计,TP332
- 中国当代建筑设计之传统意象的建构及其呈现,TU-0
- 高性能微处理器RTL级和体系结构级低功耗设计关键技术研究,TP332
- YHFT-Matrix DSP取指部件设计实现与多指令流扩展,TP368.1
- 家具设计中的“空间语言”研究,TS664.01
- 室内设计的文化内涵,J525.1
- 基于可重构平台的软硬件代码划分技术研究,TP332
- 全IP宽带移动P2P网络关键技术研究,TN915.02
- 模型驱动的SoC设计关键技术研究,TN47
- 场馆设计的研究,J525
- 混合重构系统构件的模型设计及空间搜索算法研究,TP391.3
- 粗粒度可重构体系结构建模方法研究与实现,TP311.52
- 嵌入式MIPS微处理器设计,TP332
- 手机概念设计中情境的运用研究,TN929.53
- 基于P2P Cache技术的互联网优化方案设计,TP393.02
- P2P技术在互联网中的应用研究,TP393.02
- 网络存储阵列中CACHE的设计,TP333
- 处理器性能分析模型研究,TP332
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com
|