学位论文 > 优秀研究生学位论文题录展示

面向非规则计算的帮助线程预编译技术研究

作 者: 杨四才
导 师: 古志民
学 校: 北京理工大学
专 业: 计算机科学与技术
关键词: 存储墙 非规则计算 帮助线程 预编译
分类号: TP314
类 型: 硕士论文
年 份: 2009年
下 载: 10次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着微处理器与存储器之间速度差异的日益增长,制约系统整体性能的存储墙问题也越来越严峻。现在,非规则计算出现在许多重要的科学计算应用中,由于访存模式的非规则性,使得非规则计算程序往往造成大量的缓存缺失。延迟容忍技术是克服存储墙问题的一种有效方法,已成为数据预取领域的研究热点。基于帮助线程的数据预取利用空闲的硬件上下文、投机性地预取主线程需要的数据,达到延迟隐藏的目的。由于人工书写帮助线程实现数据预取是一件非常繁琐而且耗时的工作,因此深入研究帮助线程的预编译技术,具有重要的理论意义和实用价值。本文是在共享高速缓存的多核处理器平台下,进行的面向非规则计算的帮助线程预编译技术研究。针对现有的基于帮助线程的数据预取方法,提出了一种预编译框架,自动化的完成线程的创建、数据的预取以及线程间的通信和同步工作。本文首先总结了前期研究成果中的五种数据推送框架,通过分析它们的优点和局限,提出了一种新的数据推送方法——交织同步推送方法,该方法不仅能解决不同计算量下的数据推送问题,而且具备较低的通信和同步开销的优点。实验重点是面向非规则计算的帮助线程预编译技术研究。本文在交织同步推送方法的基础上,设计了一套适用于静态帮助线程技术的预编译框架,真正实现由编译器自动生成帮助线程;最后在该框架下对多个基准测试程序进行了实验分析并获得20%以上的加速效果。

全文目录


摘要  4-5
Abstract  5-10
第1章 绪论  10-17
  1.1 研究背景及意义  10-12
    1.1.1 研究背景  10-12
    1.1.2 研究意义  12
  1.2 国内外研究现状  12-16
  1.3 研究内容及关键问题  16
  1.4 论文的组织结构  16-17
第2章 帮助线程技术基础  17-31
  2.1 引言  17
  2.2 非规则计算技术  17
  2.3 高速缓存缺失分类  17-18
  2.4 存储级并行技术  18-19
  2.5 帮助线程技术  19-28
    2.5.1 静态帮助线程技术  20-24
    2.5.2 动态帮助线程技术  24-28
  2.6 静态帮助线程技术的硬件基础  28-30
  2.7 本章小结  30-31
第3章 推送框架的优化  31-46
  3.1 引言  31
  3.2 推送方法的回顾  31-35
    3.2.1 预遍历推送方法  32
    3.2.2 块同步推送方法  32-33
    3.2.3 滑动窗口推送方法  33-34
    3.2.4 块循环推送方法  34
    3.2.5 跳跃式块循环推送方法  34-35
  3.3 推送框架的优化  35-45
    3.3.1 关键问题——计算量  36-38
    3.3.2 交织推送方法  38-42
    3.3.3 交织同步推送方法  42-45
  3.4 本章小结  45-46
第4章 面向非规则计算的帮助线程预编译框架  46-58
  4.1 引言  46
  4.2 实验工具及环境配置  46-47
    4.2.1 Rose 分析工具  46-47
    4.2.2 实验环境  47
  4.3 预编译框架设计的前期准备  47-53
    4.3.1 数据结构  47-48
    4.3.2 算法基本流程  48-49
    4.3.3 配置文件的格式  49-51
    4.3.4 预编译框架的输入参数格式  51
    4.3.5 模板文件  51-53
  4.4 预编译框架  53-57
    4.4.1 代码规格化处理  53
    4.4.2 线程创建和销毁函数  53-54
    4.4.3 辅助函数的生成  54-55
    4.4.4 热点函数的处理  55
    4.4.5 推送函数的处理  55-56
    4.4.6 对热点区域中函数调用情形的处理  56-57
  4.5 本章小结  57-58
第5章 预编译框架下的实验结果及分析  58-69
  5.1 前言  58
  5.2 实验测试环境  58-59
  5.3 基准程序的实验结果及分析  59-68
    5.3.1 基准测试程序概述  59-60
    5.3.2 基准程序的实验结果及分析  60-68
  5.4 本章小结  68-69
第6章 总结  69-71
  6.1 论文总结  69
  6.2 进一步工作  69-71
参考文献  71-74
攻读硕士学位期间的科研情况  74-75
致谢  75

相似论文

  1. 基于解释器的数据库存储过程研究,TP311.13
  2. C程序文件间依赖性分析,TP311.1
  3. 嵌入式实时数据库的用户接口与应用规范说明处理,TP311.13
  4. GKD-Base中嵌入式SQL关键技术的研究与实现,TP311.13
  5. 微处理器Cache访问行为分析技术研究,TP332
  6. 层次存储的访问分析与优化方法研究,TP333
  7. 异构多核DSP数据流前瞻关键技术研究,TP368.1
  8. 面向科学计算的PIM体系结构技术研究,TP332
  9. 面向高性能DSP Matrix向量化编译器的设计与实现,TP314
  10. 嵌入式MSDCC异构多核编译器研究,TP314
  11. 可配置TTA处理器编译器的指令调度技术研究与实现,TP314
  12. 基于值剖视的编译优化研究,TP314
  13. 基于可扩展矩阵计算DSP(FT-Matrix)的汇编器与连接器研究与实现,TP314
  14. 面向异构细粒度可重构系统的循环流水编译技术研究,TP314
  15. 基于TTCN-3抽象语法树的可执行测试套的生成研究,TP314
  16. 出具证明编译器中证明生成的研究,TP314
  17. 一种出具证明编译器中汇编级断言和证明的生成方法,TP314
  18. YHFT-DSP编译关键技术分析及实现,TP314
  19. 面向可重构阵列任务编译的循环变换技术研究,TP314
  20. BWDSP100编译器的研制及优化技术研究,TP314

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 编译程序、解释程序
© 2012 www.xueweilunwen.com