学位论文 > 优秀研究生学位论文题录展示
嵌入式处理器中低功耗的BTB研究与设计
作 者: 张祥建
导 师: 喻明艳
学 校: 哈尔滨工业大学
专 业: 微电子学与固体电子学
关键词: 低功耗 嵌入式处理器 分支预测 分支目标缓冲器
分类号: TP332
类 型: 硕士论文
年 份: 2009年
下 载: 19次
引 用: 0次
阅 读: 论文下载
内容摘要
随着集成电路制造工艺的进步和微处理器设计技术的发展,处理器的流水线级数不断加深,由控制冒险引起的吞吐率下降也随之增大,在现代深流水处理器中,分支预测技术对性能的提升起着尤其重要的作用。随着处理器规模的增大,为了追求高吞吐率,分支预测器的结构越来越复杂,用于目标地址推测的分支目标缓冲器(BTB)的容量也越来越大,而通常BTB是由SRAM单元组成的Cache结构,它的功耗开销也就成了值得关注的问题。在嵌入式处理器中,由于面积和能耗等因素的限制,设计者需要在性能和实现代价等方面做出权衡,选择面积和能耗利用效率最高的设计方案。因此,探索在嵌入式处理器中采用何种结构的分支预测器和BTB可以满足应用需求且使处理器能耗达到最低对嵌入式处理器的低功耗设计具有重要意义。为了使BTB功耗和性能的优化研究具有更高的精确度和较强的应用价值,本文实验基于RTL级硬件平台,并选择具有代表性的单发射7级流水的嵌入式处理器作为基础处理器。另外,实验还采用基于SimPoint统计采样的SPEC 2000快速模拟方法有效减小了仿真时间。本文根据嵌入式处理器中分支预测的应用需求将功耗作为首要的设计目标,在实验中将方向预测器和BTB融合为统一的模块,设计了基于RAM比较标签存储结构的BTB,并通过硬件仿真方法对不同参数的BTB结构的性能与能耗进行了研究,实验选取了128分支项32路组相联的BTB为最优结构,并将它的存储体改用CAM比较标签的存储结构来实现,相对于基于RAM比较标签的存储结构,其功耗降低了37.17%,此外,本文还通过性能与实现代价的比较选取了Round Robin为该BTB结构的最优替换算法。在此基础上,本文还提出了一种通过减小无效访问来降低BTB动态功耗的跳跃访问算法,并分析了算法在嵌入式处理器中的设计折衷,最后在硬件平台上对算法性能进行了评测:在128分支项的BTB中,跳跃访问算法可使动态功耗降低72%,而CPI损失仅为0.013%。
|
全文目录
摘要 4-5 Abstract 5-8 第1章 绪论 8-14 1.1 课题背景 8-11 1.1.1 分支指令对流水线性能的影响 8-9 1.1.2 分支预测技术简介 9-10 1.1.3 分支目标缓冲器低功耗设计的重要性 10-11 1.2 国内外研究现状 11-12 1.3 本文研究内容 12-13 1.4 本文结构 13-14 第2章 研究平台 14-24 2.1 建模层次 14 2.2 基础处理器模型 14-15 2.3 仿真环境 15-17 2.4 基准测试程序 17-23 2.4.1 快速模拟方法 17-18 2.4.2 SimPoint 统计采样 18-23 2.5 本章小结 23-24 第3章 嵌入式处理器中分支预测的需求分析与设计 24-32 3.1 分支预测技术对处理器性能的影响分析 24-26 3.2 嵌入式处理器的性能与功耗折衷分析 26-27 3.3 应用于嵌入式处理器的分支预测器结构分析 27-29 3.3.1 方向预测器 27-28 3.3.2 分支目标缓冲器 28 3.3.3 总体结构 28-29 3.4 分支目标缓冲器(BTB)的分析与设计 29-30 3.5 本章小结 30-32 第4章 嵌入式处理器中BTB 的性能与功耗优化研究 32-40 4.1 研究方法 32 4.2 BTB 结构参数选择 32-34 4.2.1 仿真方法 32 4.2.2 实验数据与分析 32-34 4.2.3 参数选择 34 4.3 BTB 存储体优化研究 34-36 4.4 BTB 替换算法选择 36-39 4.4.1 替换算法的实现 36-38 4.4.2 性能与实现代价评估 38-39 4.5 本章小结 39-40 第5章 低功耗跳跃访问BTB 的设计研究 40-49 5.1 BTB 的访问效率 40-41 5.2 跳跃访问算法 41-42 5.3 跳跃访问BTB 的硬件结构 42-43 5.4 动态跳跃访问过程 43 5.5 嵌入式处理器中跳跃访问BTB 的设计折衷 43-44 5.6 实验数据分析 44-48 5.6.1 跳跃访问算法对访问效率和功耗的影响 45-46 5.6.2 跳跃访问算法对性能的影响 46-47 5.6.3 跳跃访问算法与相关研究的比较分析 47-48 5.7 本章小结 48-49 结论 49-50 参考文献 50-54 攻读学位期间发表的学术论文 54-56 致谢 56
|
相似论文
- WCDMA终端测试仪中低功耗、低杂散频率合成器的研究与设计,TN74
- 多功能无线鼠标的研究与设计,TP334.2
- 低压低功耗CMOS模拟乘法器研究与设计,TN432
- 嵌入式手持移动设备上地理信息展示的低功耗实现,TP311.52
- 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
- 基于65nm工艺的高性能音频∑△模数转换器的研究与实现,TN792
- HART无线适配器的研究与设计,TN915.05
- 低功耗、多主接口、多图层的液晶控制器设计,TN873.93
- 自适应OFDM数字基带接收器的低功耗研究,TN851
- 基于IPv6的无线传感器网络的移动性管理技术研究,TP212.9
- 基于嵌入式系统安全的信息流监控机制的研究与实现,TP309
- 基于路预测访问的低功耗高速缓存设计研究,TP333
- 基于嵌入式Linux系统的低功耗方案的设计与实现,TP368.1
- 无源RFID标签芯片的低功耗电源管理系统,TN402
- 面向异构数据的低功耗传感器网络中TDMA协议的设计与实现,TP212.9
- 近阈值低功耗SRAM研究设计,TP333
- 锁定轨温监测节点传感单元的设计与实现,TP274
- 高性能微处理器RTL级和体系结构级低功耗设计关键技术研究,TP332
- 基于Soc的低功耗无线温湿度采集系统,TN47
- SoC芯片的低功耗物理设计研究,TN47
- 智能气体检测仪研究与设计,TH83
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com
|