学位论文 > 优秀研究生学位论文题录展示

面向异构细粒度可重构系统的循环流水编译技术研究

作 者: 杨敏
导 师: 顾国昌
学 校: 哈尔滨工程大学
专 业: 计算机应用技术
关键词: 异构可重构 C2VHDL 高带宽循环流水 变启动间距迭代模调度 自适应存储
分类号: TP314
类 型: 硕士论文
年 份: 2011年
下 载: 25次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着应用程序对计算速度需求的不断提升,高性能计算越来越受到人们的关注,成为计算机领域人们争夺的制高点。FPGA作为可重构计算引擎,能够将可重构逻辑器件与生俱来的并行性转化为超级计算能力,获得极高的处理性能,因此,基于FPGA的异构可重构混合系统正逐步成为高性能计算的重要趋势之一。然而,可重构计算缺乏自动化编译工具,随着应用程序算法复杂性的增加,手工方法的缺陷变得越来越难以容忍,面对高性能计算和自动化设计过程之间的鸿沟,C2VHDL编译技术为其搭建了一座桥梁,成为近年来学术研究的热点方向。循环是应用程序中最耗时的部分,循环流水技术可有效开发循环并行性,提高整个系统的执行效率及性能,因此,国内外很多学者在该领域进行了广泛的研究,但在编译系统中仍存在着各种不足:不支持循环携带相关;利用大量资源的耗费获取速度的提升;忽略存储系统的设计等。针对现有循环流水编译技术的缺点,本文面向步进值为常量的循环,提出了一种高带宽循环流水编译技术,结合目标体系结构,将循环自动映射成由VHDL编写的高层次并行计算模型。本文采用分治策略,分别映射生成循环流水IP核的运算、控制和存储模块:运算模块映射时,本文提出了更优的部分合并流水线划分方式,在不改变硬件电路最大运行频率的前提下,主动合并延迟较小的流水段,将同一流水段中的指令映射到同一Proccess中;控制模块映射时,本文以数组数据依赖分析为基础,提出了变启动间距迭代模调度算法,有效提高循环携带相关严重的应用程序的流水线吞吐率,基于该算法生成的流水控制模块能够良好的支持break等中断控制语句;存储模块映射时,本文根据应用程序访存特性,提出了一种自适应的参数化并行存储体系结构模型,支持输入相关数据重用、循环携带流相关数据重用及数据的并行访问,模型的参数由编译器基于自适应存储算法生成。在流水并行度为8的情况下,该存储模型可将吞吐率提升7-12倍。本文对遇到的问题提出了高效的解决方案,实验结果表明,本文提出的相关算法和模型能获得良好的流水性能和软硬件加速比,对循环流水技术的研究具有一定的推进作用。

全文目录


摘要  5-6
Abstract  6-10
第1章 绪论  10-18
  1.1 课题研究的目的和意义  10-11
  1.2 国内外研究发展现状  11-14
  1.3 论文的主要工作  14-15
  1.4 论文的组织结构  15-18
第2章 异构细粒度可重构系统架构概述  18-28
  2.1 系统整体架构  18-22
    2.1.1 CPU+FPGA异构细粒度可重构验证平台  19
    2.1.2 LLVM简介  19-20
    2.1.3 ASCRA编译器简介  20-22
  2.2 相关概念  22-26
    2.2.1 循环流水  22-23
    2.2.2 数据依赖  23-25
    2.2.3 流水线冲突  25-26
  2.3 本章小结  26-28
第3章 循环流水IP核研究设计与实现  28-66
  3.1 高带宽循环流水识别  30-31
  3.2 流水线数据模块  31-36
    3.2.1 分离存储与运算  31-32
    3.2.2 流水线划分算法  32-36
  3.3 参数化并行存储体系结构模型  36-56
    3.3.1 自适应存储体系结构模型  36-37
    3.3.2 分体并行存储结构模型  37-39
    3.3.3 输入数据重用缓存结构模型  39-43
    3.3.4 写后读数据重用缓存结构模型  43-47
    3.3.5 自适应存储算法  47-56
  3.4 循环流水调度  56-64
    3.4.1 流水线冲突避免  57-62
    3.4.2 控制模块设计及生成  62-64
  3.5 高带宽循环流水自动映射  64-65
  3.6 本章小结  65-66
第4章 实验与系统性能评测  66-74
  4.1 系统性能评测  66-69
    4.1.1 资源利用  66-67
    4.1.2 运行频率  67
    4.1.3 流水性能  67-69
  4.2 性能对比  69-73
    4.2.1 核心加速比  69-72
    4.2.2 整体加速比  72-73
  4.3 本章小结  73-74
结论  74-76
参考文献  76-82
攻读硕士学位期间发表的论文和取得的科研成果  82-84
致谢  84

相似论文

  1. C2VHDL编译中的指针映射方法研究,TP312.1
  2. 基于架构和任务调度的FPGA低功耗研究,TN791
  3. 面向高性能DSP Matrix向量化编译器的设计与实现,TP314
  4. 嵌入式MSDCC异构多核编译器研究,TP314
  5. 可配置TTA处理器编译器的指令调度技术研究与实现,TP314
  6. 基于值剖视的编译优化研究,TP314
  7. 基于可扩展矩阵计算DSP(FT-Matrix)的汇编器与连接器研究与实现,TP314
  8. 基于TTCN-3抽象语法树的可执行测试套的生成研究,TP314
  9. 出具证明编译器中证明生成的研究,TP314
  10. 一种出具证明编译器中汇编级断言和证明的生成方法,TP314
  11. YHFT-DSP编译关键技术分析及实现,TP314
  12. 面向非规则计算的帮助线程预编译技术研究,TP314
  13. 面向可重构阵列任务编译的循环变换技术研究,TP314
  14. BWDSP100编译器的研制及优化技术研究,TP314
  15. 即时编译器辅助的内存管理优化,TP314
  16. 基于网格的UDLC语言编译器的实现,TP314
  17. G(?)del语言编译系统中实现计算可视化,TP314
  18. 基于SWF中AS的反编译的研究,TP314
  19. 基于动态二进制翻译技术的反编译研究,TP314
  20. 一种改进QEMU精确异常处理机制的研究,TP314

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 编译程序、解释程序
© 2012 www.xueweilunwen.com