学位论文 > 优秀研究生学位论文题录展示

记录式分支预测器

作 者: 蒋冠军
导 师: 陈天洲;施青松
学 校: 浙江大学
专 业: 计算机应用技术
关键词: 分支预测 别名 噪音 多路 栈式 记录式 预测器 Gshare 2Bc-gskew
分类号: TP332
类 型: 硕士论文
年 份: 2010年
下 载: 40次
引 用: 0次
阅 读: 论文下载
 

内容摘要


分支预测技术的不断改进使得处理器的性能得到极大的提升,两级模式分支预测器以其简单结构和高效性能被广泛应用。但是该类预测器存在几个严重的缺陷,它们分别是分支别名、历史噪音多路存取。前人对分支别名和历史噪音问题作出了大量的研究,取得了非常大的改进,但是并没有完全解决这两个问题,还有改进的空间。同时以前的研究并没有考虑由于多路存取而造成的预测错误。本文总结了分支别名和历史噪音的问题,提出模式分支预测中多路存取的问题,描述了由于多路存取带来的分支预测错误问题,分析了循环和函数调用对分支历史的影响,提出了基于循环和函数调用的栈式分支预测结构,它过滤循环和函数体外的分支对循环和函数体内分支预测的干扰。然后又根据栈式结构提出了记录式分支预测结构。记录式分支预测结构是在分支预测时维护和选择GHR值的硬件结构,它不影响原来预测器的更新过程,不需要改变原来预测器的组织结构,能够被使用在任何的模式预测器上。记录式结构有3条分支预测原则,这3条原则通过保证预测过程中遇到多路存取时访问相同分支修改的PHT项,减少了历史噪音对分支预测的错误影响。记录式结构对分支别名无效。本文在simplescalar模拟器上修改了Gshare预测器,实现了记录式Gshare预测器,同时还实现了2Bc-gskew预测器和记录式2Bc-gskew预测器。实验结果显示,具有记录式分支预测结构的预测器比原来预测器具有更少的分支预测错误。而且在一般情况下,随着记录式结构PC记录的长度变长和PHT容量增大,记录式结构能够减少更多的预测错误比例。当PC记录为20项,PHT容量为4096项时,记录式Gshare能够比Gsharep平均减少7.6%的分支预测错误,记录式2Bc-gskew能够比2Bc-gskew平均减少1 4.5%的分支预测错误。

全文目录


摘要  4-5
Abstract  5-10
第1章 绪论  10-16
  1.1 课题背景  10-13
    1.1.1 分支预测的背景  10-11
    1.1.2 两级分支预测的缺陷  11-13
  1.2 本文工作  13-15
  1.3 论文组织结构  15
  1.4 本章小结  15-16
第2章 分支预测器概述  16-28
  2.1 程序和体系结构的分支特性  16
  2.2 分支预测技术  16-24
    2.2.1 静态分支预测  16-17
    2.2.2 动态分支预测  17-20
    2.2.3 分支别名干扰  20-22
    2.2.4 分支历史信息干扰  22-24
  2.3 多核结构下分支预测的挑战  24-27
  2.4 本章小结  27-28
第3章 栈式记录式分支预测器设计动机  28-38
  3.1 基于模式动态分支预测器的缺陷  28-29
    3.1.1 别名和历史噪音  28-29
    3.1.2 多路存取  29
  3.2 分支层次  29-35
    3.2.1 通过层次降低噪音  30-32
    3.2.2 层次的特性  32-34
    3.2.3 存在的问题  34-35
  3.3 地址比较GHR选择  35-37
  3.4 本章小结  37-38
第4章 栈式和记录式分支预测器结构设计  38-53
  4.1 栈式结构设计  38-42
  4.2 栈式结构性能分析  42-43
  4.3 记录式结构设计  43-46
  4.4 Gshare与记录式Gshare实例比较  46-50
  4.5 记录式2Bc-gskew预测器  50-52
  4.6 本章小结  52-53
第5章 实验设计与数据分析  53-70
  5.1 实验平台和设计  53-54
  5.2 实验结果和分析  54-69
    5.2.1 栈式Gshare预测器性能测试  54-56
    5.2.2 PC记录和GHR组的容量设置  56-58
    5.2.3 记录式Gshare性能分析  58-64
    5.2.4 记录式2Bc-gskew性能分析  64-69
  5.3 本章小结  69-70
第6章 总结与展望  70-72
  6.1 总结  70
  6.2 展望  70-72
参考文献  72-75
作者简历及在学期间所取得的科研成果  75-76
致谢  76

相似论文

  1. 基于内容的服装图像检索技术研究及实现,TP391.41
  2. 经历·记忆·叙述,I712.074
  3. 低压齿轮泵噪音分析与控制,TH325
  4. 分布式视频存储系统设计与实现,TP333
  5. 工业分布式实时数据库网络通信平台的研究与设计,TP311.13
  6. 高精度模拟测量电路精度增长方法的研究,TN710
  7. 多管阵列定向语音增强系统的研制,TN912.35
  8. 面向异构数据的低功耗传感器网络中TDMA协议的设计与实现,TP212.9
  9. 三维显示的计算机相关技术研究,TP391.41
  10. 多路电控功分移相一体化网络模块的软硬件设计与研制,TP311.1
  11. 基于NAND FLASH的多路并行存储系统的研究与实现,TP333
  12. 乘法器复用的多路FFT处理器研究与设计,TN919.3
  13. 金属枝晶生长的相场法数值模拟,TG113
  14. 多路功能型时序电子治疗仪的研究,R197.39
  15. 基于三维光谱模型的高光谱图像压缩方法的研究,TP751.1
  16. 变频滚动活塞压缩机噪音振动优化,TB652
  17. 辐射采暖嵌入式远传控制器及监控系统的设计,TP273.5
  18. 路由器级网络拓扑发现技术研究,TP393.02
  19. 基于R树的K-匿名技术研究,TP311.13
  20. 基于DirectShow技术的多路立体视频实时显示研究,TP391.41
  21. 基于TMS320C6713的DSP系统软件设计与实现,TP368.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com