学位论文 > 优秀研究生学位论文题录展示

嵌入式多核编译器研究与开发

作 者: 吴康
导 师: 陈清华
学 校: 南京理工大学
专 业: 计算机应用技术
关键词: 嵌入式多核 程序并行化 数据局部性 片上存储器 循环调度
分类号: TP314
类 型: 硕士论文
年 份: 2008年
下 载: 325次
引 用: 2次
阅 读: 论文下载
 

内容摘要


随着集成电路物理极限的到来,单单通过提高处理器速度来提高计算能力的方法已越来越困难。所以通过增加处理器(或运算部件)个数来补偿单个处理器运算能力的不足,成为满足不断增长的运算能力需求最有希望的选择。多核设计的优点是在频率不变的情况下让处理器的性能获得明显提升,这一点将是未来嵌入式系统的发展趋势。为了尽可能减少程序员针对多核系统编写多线程程序的难度和复杂性以及利用大量的现存代码,将串行程序进行并行化编译处理将是一个很有前途的解决方法。本文针对在嵌入式系统中广泛使用SPM提高SoC存储子系统的性能,介绍了一种基于SPM的多核嵌入式系统循环调度算法,它能够尽量使分配到各个处理器上的循环迭代空间的执行时间保持一致。为了进一步地发掘嵌套循环的并行性和数据访问的时间局部性,对算法增加了一个线性循环变换的功能模块来进行改进。为了提高嵌套循环中数组访问Cache局部性,提高Cache命中率,通过编译优化方法的两种主要手段是循环变换和数据变换,本文将改进后的循环调度算法与一种基于投影分层技术的数据变换算法进行结合,最终形成一个通过有效提高SPM使用率从而加快嵌入式多核应用程序执行效率的解决方案。最后,用C++语言实现了本文所给出的解决方案,开发了一个适用于嵌入式多核的编译系统,并且通过实验证明给出的解决方案能够有效提高应用程序的执行效率。

全文目录


摘要  3-4
Abstract  4-7
1 绪论  7-11
  1.1 课题来源  7
  1.2 选题背景及当前研究现状  7-10
  1.3 本文的主要内容及组织结构  10-11
2 嵌入式系统编译技术概述  11-21
  2.1 编译技术及嵌入式系统  11-16
    2.1.1 编译程序  11-13
    2.1.2 嵌入式系统概念及特点  13-15
    2.1.3 交叉编译系统简介  15-16
  2.2 嵌入式系统编译技术的研究现状  16-20
  2.3 本章小结  20-21
3 嵌入式多核编译系统程序并行化实现技术  21-43
  3.1 嵌入式多核程序并行化技术的研究现状  21-23
  3.2 依赖关系分析  23-33
    3.2.1 依赖关系概念  23-24
    3.2.2 数据依赖关系分析  24-27
    3.2.3 循环中的依赖关系测试  27-33
  3.3 程序并行化基本理论  33-42
    3.3.1 数据划分与处理器分配  35-38
    3.3.2 循环变换技术  38-42
  3.4 本章小结  42-43
4 嵌入式多核编译系统算法实现  43-56
  4.1 基于投影分层技术的嵌套循环数据变换算法  43-48
    4.1.1 数据局部性概述  43-44
    4.1.2 嵌套循环中数据访问轨迹  44-46
    4.1.3 数据变换优化具有类仿射下标数组的空间局部性  46-48
  4.2 基于SPM的嵌入式多核循环调度算法  48-53
    4.2.1 目标机体系结构和相关定义  48-49
    4.2.2 算法模型  49-51
    4.2.3 循环分配算法  51
    4.2.4 算法改进  51-53
  4.3 改进后的循环调度与数据变换相结合  53-55
  4.4 本章小结  55-56
5 嵌入式多核编译系统开发及并行化性能测试  56-67
  5.1 嵌入式多核编译系统开发  56-64
    5.1.1 编译系统的整体框架  56-57
    5.1.2 编译系统的模块功能  57-64
  5.2 嵌入式多核编译系统并行化性能测试  64-66
  5.3 本章小结  66-67
6 结束语  67-69
  6.1 总结  67-68
  6.2 下一步的工作  68-69
致谢  69-70
参考文献  70-73

相似论文

  1. 嵌入式MSDCC异构多核编译器研究,TP314
  2. 串行程序并行化及其在桌面网格中的应用,TP311.11
  3. 基于嵌入式多核平台的并行冗余线程容错技术研究,TP302.8
  4. 基于blackfin561的硬件平台构建和底层系统实现,TP332
  5. 基于多核处理器串行程序并行化改造和性能优化,TP311.11
  6. 嵌入式图像压缩系统的程序优化技术研究,TP391.41
  7. 基于Linux环境下的分布式存储系统的研究与实现,TP333
  8. 全局循环合并的实现,TP332
  9. 列队竞争算法在化工生产调度中的应用研究,TQ021.8
  10. 基于Petri网的交换机与加权循环调度算法建模与性能分析,TP391.9
  11. 数据分布和收集代码自动生成及优化技术研究,TP314
  12. 应用PIC/MC方法研究电子储存环中束内散射效应,TL594
  13. 面向软件管理片上存储器的编译优化技术研究,TP333
  14. 稀薄气体Monte Carlo数值仿真并行化技术研究与实现,TP391.9
  15. 数据局部性及其编译优化技术研究,TP332
  16. 机群系统OpenMP研究,TP338.6
  17. 提高机群OpenMP系统性能的关键技术研究,TP338
  18. SoC芯片测试效率和成品率的研究和应用,TN47
  19. 基于SPM的寄存器抛出能耗优化研究,TN402
  20. 基于ScratchPad Memory的实时性研究,TP368.11

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 编译程序、解释程序
© 2012 www.xueweilunwen.com