学位论文 > 优秀研究生学位论文题录展示
面向异构细粒度可重构系统的循环流水编译技术研究
作 者: 杨敏
导 师: 顾国昌
学 校: 哈尔滨工程大学
专 业: 计算机应用技术
关键词: 异构可重构 C2VHDL 高带宽循环流水 变启动间距迭代模调度 自适应存储
分类号: TP314
类 型: 硕士论文
年 份: 2011年
下 载: 25次
引 用: 0次
阅 读: 论文下载
内容摘要
随着应用程序对计算速度需求的不断提升,高性能计算越来越受到人们的关注,成为计算机领域人们争夺的制高点。FPGA作为可重构计算引擎,能够将可重构逻辑器件与生俱来的并行性转化为超级计算能力,获得极高的处理性能,因此,基于FPGA的异构可重构混合系统正逐步成为高性能计算的重要趋势之一。然而,可重构计算缺乏自动化编译工具,随着应用程序算法复杂性的增加,手工方法的缺陷变得越来越难以容忍,面对高性能计算和自动化设计过程之间的鸿沟,C2VHDL编译技术为其搭建了一座桥梁,成为近年来学术研究的热点方向。循环是应用程序中最耗时的部分,循环流水技术可有效开发循环并行性,提高整个系统的执行效率及性能,因此,国内外很多学者在该领域进行了广泛的研究,但在编译系统中仍存在着各种不足:不支持循环携带相关;利用大量资源的耗费获取速度的提升;忽略存储系统的设计等。针对现有循环流水编译技术的缺点,本文面向步进值为常量的循环,提出了一种高带宽循环流水编译技术,结合目标体系结构,将循环自动映射成由VHDL编写的高层次并行计算模型。本文采用分治策略,分别映射生成循环流水IP核的运算、控制和存储模块:运算模块映射时,本文提出了更优的部分合并流水线划分方式,在不改变硬件电路最大运行频率的前提下,主动合并延迟较小的流水段,将同一流水段中的指令映射到同一Proccess中;控制模块映射时,本文以数组数据依赖分析为基础,提出了变启动间距迭代模调度算法,有效提高循环携带相关严重的应用程序的流水线吞吐率,基于该算法生成的流水控制模块能够良好的支持break等中断控制语句;存储模块映射时,本文根据应用程序访存特性,提出了一种自适应的参数化并行存储体系结构模型,支持输入相关数据重用、循环携带流相关数据重用及数据的并行访问,模型的参数由编译器基于自适应存储算法生成。在流水并行度为8的情况下,该存储模型可将吞吐率提升7-12倍。本文对遇到的问题提出了高效的解决方案,实验结果表明,本文提出的相关算法和模型能获得良好的流水性能和软硬件加速比,对循环流水技术的研究具有一定的推进作用。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-18 1.1 课题研究的目的和意义 10-11 1.2 国内外研究发展现状 11-14 1.3 论文的主要工作 14-15 1.4 论文的组织结构 15-18 第2章 异构细粒度可重构系统架构概述 18-28 2.1 系统整体架构 18-22 2.1.1 CPU+FPGA异构细粒度可重构验证平台 19 2.1.2 LLVM简介 19-20 2.1.3 ASCRA编译器简介 20-22 2.2 相关概念 22-26 2.2.1 循环流水 22-23 2.2.2 数据依赖 23-25 2.2.3 流水线冲突 25-26 2.3 本章小结 26-28 第3章 循环流水IP核研究设计与实现 28-66 3.1 高带宽循环流水识别 30-31 3.2 流水线数据模块 31-36 3.2.1 分离存储与运算 31-32 3.2.2 流水线划分算法 32-36 3.3 参数化并行存储体系结构模型 36-56 3.3.1 自适应存储体系结构模型 36-37 3.3.2 分体并行存储结构模型 37-39 3.3.3 输入数据重用缓存结构模型 39-43 3.3.4 写后读数据重用缓存结构模型 43-47 3.3.5 自适应存储算法 47-56 3.4 循环流水调度 56-64 3.4.1 流水线冲突避免 57-62 3.4.2 控制模块设计及生成 62-64 3.5 高带宽循环流水自动映射 64-65 3.6 本章小结 65-66 第4章 实验与系统性能评测 66-74 4.1 系统性能评测 66-69 4.1.1 资源利用 66-67 4.1.2 运行频率 67 4.1.3 流水性能 67-69 4.2 性能对比 69-73 4.2.1 核心加速比 69-72 4.2.2 整体加速比 72-73 4.3 本章小结 73-74 结论 74-76 参考文献 76-82 攻读硕士学位期间发表的论文和取得的科研成果 82-84 致谢 84
|
相似论文
- C2VHDL编译中的指针映射方法研究,TP312.1
- 基于架构和任务调度的FPGA低功耗研究,TN791
- 面向高性能DSP Matrix向量化编译器的设计与实现,TP314
- 嵌入式MSDCC异构多核编译器研究,TP314
- 可配置TTA处理器编译器的指令调度技术研究与实现,TP314
- 基于值剖视的编译优化研究,TP314
- 基于可扩展矩阵计算DSP(FT-Matrix)的汇编器与连接器研究与实现,TP314
- 基于TTCN-3抽象语法树的可执行测试套的生成研究,TP314
- 出具证明编译器中证明生成的研究,TP314
- 一种出具证明编译器中汇编级断言和证明的生成方法,TP314
- YHFT-DSP编译关键技术分析及实现,TP314
- 面向非规则计算的帮助线程预编译技术研究,TP314
- 面向可重构阵列任务编译的循环变换技术研究,TP314
- BWDSP100编译器的研制及优化技术研究,TP314
- 即时编译器辅助的内存管理优化,TP314
- 基于网格的UDLC语言编译器的实现,TP314
- G(?)del语言编译系统中实现计算可视化,TP314
- 基于SWF中AS的反编译的研究,TP314
- 基于动态二进制翻译技术的反编译研究,TP314
- 一种改进QEMU精确异常处理机制的研究,TP314
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 编译程序、解释程序
© 2012 www.xueweilunwen.com
|