学位论文 > 优秀研究生学位论文题录展示

龙芯2号链接后优化器的实现与分析

作 者: 陈瑜
导 师: 唐志敏
学 校: 中国科学院研究生院(计算技术研究所)
专 业: 计算机系统结构
关键词: 链接后优化 GLTO 龙芯2号处理器
分类号: TP332
类 型: 硕士论文
年 份: 2006年
下 载: 61次
引 用: 0次
阅 读: 论文下载
 

内容摘要


链接后优化技术是在编译链接后对整个可执行程序再进行优化的一种技术。一方面,它克服了传统编译器的优化局限于一个函数、一个模块的缺点,将优化范围扩展到整个程序。另一方面,它充分利用了链接后确定的信息,发掘出更多的优化机会。我们参照Arizona大学为Alpha处理器设计的链接后优化器ALTO,针对龙芯2号处理器的微体系结构和指令集的特征,实现了龙芯上的链接后优化器GLTO(Godson Link TimeOptimizer)。GLTO使得龙芯处理器SPEC2000定点程序reference分值在龙芯2C平台上提高了9.4%,在龙芯2E平台上提高了9.2%,具有显著的优化效果。本文分析了主要优化策略的效果和产生的原因,提出了处理器的结构设计中的改进设想,结合龙芯处理器的指令集和结构特征提出了相关的优化,针对2E平台的特性提出了优化策略,并分析了优化选项的组合,最后将GLTO与ALTO做了对比分析。

全文目录


摘要  4-8
图目录  8-10
表目录  10-11
第一章 引言  11-19
  1.1 链接后优化概述  11
  1.2 链接后优化分类  11-14
  1.3 链接后优化的优势  14-15
  1.4 本文的相关工作  15
  1.5 本文的贡献  15-16
  1.6 论文的组织  16-19
第二章 链接后优化器的原理和实现  19-23
  2.1 链接后优化的原理  19-20
  2.2 实现和关键技术  20-23
    2.2.1 读入  20
    2.2.2 反汇编  20-21
    2.2.3 构造控制流图  21-22
    2.2.4 优化分析  22
    2.2.5 程序汇编  22
    2.2.6 文件信息修复  22-23
第三章 优化效果分析  23-33
  3.1 消除不可到达代码  23
  3.2 全局常数传播  23-25
  3.3 过程间生存期分析  25-26
  3.4 间接调用转换为直接调用  26-28
  3.5 访存优化  28-29
  3.6 内联优化  29
  3.7 基于profile 的分析和优化  29-30
  3.8 优化分析小结  30-33
第四章 针对指令集缺陷的优化  33-49
  4.1 转移指令offset 位溢出问题  33-34
  4.2 影响转移指令offset 位溢出的因素  34-36
  4.3 处理溢出指令的两种简单策略  36-38
    4.3.1 直接跳转(direct jumping) 策略  36-37
    4.3.2 远程跳转(distant jumping) 策略  37-38
  4.4 双向代码重排算法(BCL)  38-44
    4.4.1 链接基本块(basic block chaining)  39
    4.4.2 构建超链(super chain forming)  39-40
    4.4.3 排布超链(super chain layout)  40-44
  4.5 性能分析对比  44-49
第五章 龙芯2E 平台相关优化  49-55
  5.1 Move Condition 优化  49-51
    5.1.1 基本算法  49-50
    5.1.2 性能分析对比  50-51
  5.2 2E 平台优化选项效果分析  51-52
  5.3 2E 平台优化选项组合  52-55
第六章 GLTO 与ALTO 对比分析  55-59
  6.1 优化效果差异分析  55-57
  6.2 优化策略差异  57-59
第七章 结束语  59-61
  7.1 本文工作总结  59
  7.2 下一步研究方向  59-61
参考文献  61-63
致谢  63-64
作者简历  64

相似论文

  1. 图形化组态的图像处理实验系统的设计与优化,TP391.41
  2. 链接后优化在龙芯上的实现,TP314
  3. 高可靠处理器体系结构研究,TP332
  4. 存储控制系统性能优化技术研究,TP333
  5. 基于SOPC的可穿戴机多处理器设计,TP332
  6. 基于函数动态重用的处理器性能优化研究,TP332
  7. 处理器TI DSP VC33虚拟核的设计与实现,TP332
  8. 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
  9. 基于宏单元异步乘法器的研究与设计,TP332.22
  10. 嵌入式处理器中多媒体加速单元的研究,TP332
  11. 可重构宏流水加速器的研究与实现,TP332
  12. 基于忆阻器的加法器和乘法器高效设计与模拟,TP332.2
  13. 并行反馈进位加法器研究,TP332.21
  14. 高性能低功耗多核处理器研究,TP332
  15. 多处理器全局FP调度算法的研究,TP332
  16. 基于可重构平台的软硬件代码划分技术研究,TP332
  17. 基于GPU的程序分析与并行化研究,TP332
  18. 基于显式通信指令集的分片式处理器模拟器开发,TP332
  19. CPU/GPU异构多核虚拟执行环境框架的设计与实现,TP332
  20. FT-Matrix处理器指令集与指令派发设计,TP332
  21. GPGPU多核流体系结构与功耗模拟研究,TP332

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com