学位论文 > 优秀研究生学位论文题录展示

多路径Trace处理器

作 者: 杜贵然
导 师: 周兴铭
学 校: 中国人民解放军国防科学技术大学
专 业: 计算机科学与技术
关键词: 微体系结构 Trace Cache Trace处理器 多路径执行 Trace预构 分支预测置信度
分类号: TP332
类 型: 博士论文
年 份: 2001年
下 载: 137次
引 用: 4次
阅 读: 论文下载
 

内容摘要


据估计,未来半导体技术仍将保持持续稳定的发展势头,可以预期未来的芯片上将集成巨大数目的晶体管。当前,如何利用这些晶体管实现更高性能的处理器是体系结构研究的热点,也是面临的挑战。 前瞻执行是提高处理器性能的一条途径。本文分析高性能处理器大量应用前瞻技术带来的问题。特别是深度前瞻技术在长流水线机器中的应用,使系统复杂性上升,前瞻错误的开销增大。针对前瞻技术的不足,本课题提出并研究了“多路径Trace处理器”(MPTP)模型。 MPTP模型对低可预测性分支采取分支两个方向同时执行,减少前瞻错误的开销;对高可预测性分支采取单路径前瞻执行,实现大指令窗口。MPTP处理器以Trace处理器为基础,重复设置多个超标量处理单元,把指令流的多条Trace发送到处理单元同时执行。 本文分析了MPTP模型的设计思想,研究了MPTP的执行机制,给出了MPTP的结构设计,并通过模拟实验验证MPTP的关键技术。总结起来,MPTP的关键技术有: 1.基于分支可预测性的多路径执行——MPEBP机制。MPEBP评估分支的可预测性,然后根据评估结果决定分支的执行模式。置信度阀值是评估分支可预测性的关键,不同的阀值影响路径的派生和资源的使用。 2.基于分支目标提取的Trace预构——TPBTP机制。TPBTP机制从直接分支指令中提取目标地址,弥补分支预测和分支目标缓存的不足,加速指令读取,实现Trace预构。 3.多路径执行的控制机制。多路径的执行控制将路径中的分支方向编码为路径标识,辨别不同Trace之间的路径隶属关系,以此为基础,实施多条Trace执行时的数据和控制信息的正确传播。 4.Trace的执行控制机制。Trace的执行开发程序的控制无关性,粗/细两种粒度的控制无关性相结合实现指令窗口的层次式管理。指令窗口的层次式管理降低了复杂性。 本文采用处理器体系结构研究广泛认可的SimpleScalar模拟器验证MPTP的设计思想。本文根据MPTP模型对模拟器进行了必要的扩充。模拟器以SPECint95程序进行基准测试。 模拟实验表明,在资源约束的条件下,MPEBP机制对错误预测的分支有较高的覆盖率,TPBTP机制有效提高了指令的读取速度,MPTP处理器的整体性能有显著的提高。总的来说,MPTP处理器模型是实现宽指令发射的一种有潜力的模型。 本论文的主要研究成果:独创性地提出并研究了多路径Trace处理器——MPTP的结构和实现机制。

全文目录


摘要  7-9
ABSTRACT  9-11
第一章 绪论  11-17
  1.1 研究背景及目标  11-14
    1.1.1 处理器体系结构研究的机遇和挑战  11-12
    1.1.2 指令级并行性前景  12
    1.1.3 主要的处理器结构  12-13
    1.1.4 二进制代码兼容  13-14
    1.1.5 深度前瞻的障碍  14
  1.2 论文的工作  14-15
  1.3 论文结构  15-17
第二章 相关研究现状  17-31
  2.1 前瞻执行技术  17-20
    2.1.1 高带宽指令读取  18-19
    2.1.2 前瞻执行的指令发射  19-20
    2.1.3 前瞻执行技术的小结  20
  2.2 多路径执行  20-23
    2.2.1 短流水线的多路径执行  21
    2.2.2 有限的多路径执行  21-22
    2.2.3 条件执行  22-23
  2.3 TRACE机制研究现状  23-28
    2.3.1 Trace Cache机制  23-26
    2.3.2 Trace处理器  26-27
    2.3.3 Trace预构  27-28
    2.3.4 Trace机制小结  28
  2.4 小结  28-31
第三章 多路径TRACE处理器MPTP模型  31-43
  3.1 MPTP的设计原则  31-36
    3.1.1 错误的分支预测不可消除  31-32
    3.1.2 错误前瞻的代价越来越大  32-34
    3.1.3 多路径执行--以资源换速度  34-35
    3.1.4 多路执行与深度前瞻的折衷  35
    3.1.5 带宽换速度  35-36
  3.2 MPTP处理器模型  36-40
    3.2.1 多路径Trace执行  37-38
    3.2.2 MPTP系统结构  38-39
    3.2.3 多路径控制器MPC  39
    3.2.4 Trace预处理器TPP  39
    3.2.5 Trace执行处理器TEP  39-40
    3.2.6 程序结果的递交机制  40
  3.3 MPTP的关键技术  40
  3.4 单路径TRACE处理器与MPTP的类比  40-41
  3.5 小结  41-43
第四章 基于分支可预测性的多路径执行  43-59
  4.1 分支预测及置信度评估  43-47
    4.1.1 分支预测器  44-45
    4.1.2 分支预测置信度的评估方法  45-46
    4.1.3 分支预测正确性历史表BPCIHT  46-47
    4.1.4 评估分支预测置信度  47
  4.2 置信度阀值研究  47-54
  4.3 派生路径  54-56
    4.3.1 分支可预测性评估  54
    4.3.2 路径的派生--分支两个方向同时执行  54-55
    4.3.3 路径派生的资源控制  55-56
  4.4 多路径执行的性能评价  56-57
  4.5 小结  57-59
第五章 TRACE预处理  59-77
  5.1 TRACE预处理器TPP结构  59-61
  5.2 程序控制无关性  61-66
    5.2.1 Trace选择:实现Trace一级的指令流聚合  63-64
    5.2.2 细粒度控制无关的Trace选择算法  64-65
    5.2.3 细粒度控制无关的Trace选择  65-66
    5.2.4 粗粒度控制无关的Trace选择  66
  5.3 分支目标提取  66-72
    5.3.1 分支目标提取的必要性  66-67
    5.3.2 分支指令分析  67-68
    5.3.3 分支目标提取BTP  68-72
  5.4 基于BTP的TRACE预构  72-74
    5.4.1 Trace构造  72-73
    5.4.2 基于BTP的Trace预构TPBTP  73-74
  5.5 TPBTP性能评价  74-75
  5.6 小结  75-77
第六章 多路径控制  77-87
  6.1 多路径控制器MPC  77-78
  6.2 路径标识  78-81
    6.2.1 路径的标识方法  78-80
    6.2.2 Trace的标识及Trace中的指令标识  80
    6.2.3 Trace缓冲区的路径标识逻辑  80-81
  6.3 多条路径执行  81-85
    6.3.1 Trace缓冲区  82
    6.3.2 主控Trace  82-83
    6.3.3 Trace的调度  83
    6.3.4 执行结果递交  83-85
  6.4 小结  85-87
第七章 执行TRACE  87-99
  7.1 开发层次性  87-90
  7.2 控制流无关性分析  90-93
    7.2.1 前瞻Trace的窗口管理  92-93
    7.2.2 数据流管理  93
  7.3 处理单元的执行控制  93-98
    7.3.1 寄存器重命名表  94
    7.3.2 分配和释放处理单元  94-95
    7.3.3 指令唤醒  95-96
    7.3.4 存储器访问  96-97
    7.3.5 精确中断的处理  97
    7.3.6 程序返回地址栈  97-98
    7.3.7 Cache设计  98
  7.4 小结  98-99
第八章 模拟器及测试程序  99-107
  8.1 SIMPLESCALAR模拟器  99-104
    8.1.1 模拟器软件结构  100
    8.1.2 模拟器功能简介  100-101
    8.1.3 模拟器指令集及POSIX系统调用  101
    8.1.4 模拟器软件组成  101-102
    8.1.5 模拟器安装  102
    8.1.6 测试程序的处理流程  102-103
    8.1.7 模拟器运行  103-104
  8.2 SPECINT95测试程序  104-105
  8.3 实验环境  105-106
  8.4 小结  106-107
第九章 结束语  107-111
  9.1 所做的工作和创新  107-109
  9.2 下一步的工作  109-111
攻读博士学位期间发表的论文  111-112
致谢  112-113
参考文献  113-118

相似论文

  1. 网络处理器中处理单元的设计与实现,TP332
  2. 基于微体系结构分析的旁道攻击及其防御技术研究,TP309
  3. 高性能、低功耗VLIW结构数字信号处理器(DSP)的研究:模型、算法与工程实践,TN911.72
  4. 处理器微体系结构模拟加速策略研究,TP332
  5. 微处理器性能分析模型的建立和研究,TP332
  6. 微处理器性能分析与优化,TP332
  7. 龙芯2号处理器多线程技术研究,TP332
  8. 高性能数字信号处理器的研究与设计,TN911
  9. 基于SOPC的可穿戴机多处理器设计,TP332
  10. 基于函数动态重用的处理器性能优化研究,TP332
  11. 处理器TI DSP VC33虚拟核的设计与实现,TP332
  12. 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
  13. 面向存储器完整性验证的Cache设计,TP332
  14. 基于宏单元异步乘法器的研究与设计,TP332.22
  15. 嵌入式处理器中多媒体加速单元的研究,TP332
  16. 多核系统中实时任务调度算法的研究,TP332
  17. 高效能嵌入式处理器IP核,TP332
  18. 多核系统中基于温度限制的节能调度算法研究,TP332
  19. 基于锁感知的多处理机VCPU调度系统,TP332
  20. 基于JTAG的ARM11调试软件的设计与实现,TP332
  21. 虚拟计算环境中CPU开销的测量系统,TP332

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com