学位论文 > 优秀研究生学位论文题录展示

基于PIM技术的数据并行计算研究

作 者: 师小丽
导 师: 张发存
学 校: 西安理工大学
专 业: 计算机应用技术
关键词: PIM技术 数据并行 仿真器 操作模型 指令集
分类号: TP338.6
类 型: 硕士论文
年 份: 2009年
下 载: 10次
引 用: 0次
阅 读: 论文下载
 

内容摘要


论文针对多媒体数据量大、实时性要求高,以及空间应用要求体积小、功耗低等特点,研究了基于PIM技术的数据带宽解决问题。传统的cache组织,解决的只是处理器的时间延迟问题,并不能用来解决处理器的存储带宽问题。PIM技术在DRAM芯片上集成了处理器,从而降低了存储延迟,增加了处理器与存储器之间的数据带宽。论文主要研究了将PIM技术应用在SIMD处理器上的可行性和带宽问题。首先给出数据并行处理器的操作模型,详细介绍了一维SIMD的结构图、寻址方式、数据类型、流水线等,这个一维SIMD芯片上集成128个PE处理元和24M的DRAM,是根据沈老师对LS MPP的研究数据得来的。然后设计了处理器的指令集,列举每种指令格式和每条指令的助记符以及功能。针对基于PIM技术的一维SIMD处理器,论文设计了此体系的汇编器、连接器、加载器和可视化界面。汇编器可以进行词法、语法、语义的扫描及检测,并将用户汇编程序翻译成目标文件,连接器再将其翻译为可执行文件。加载器主要是加载用户程序和数据到存储器。论文针对基于PIM技术的一维数据并行处理器的操作模型,设计了该模型的解释型指令级仿真器,并阐述了关键技术。仿真器主要模拟了流水线的时间并行性、PE阵列的空间并行性、控制器部件和解码器。仿真器测试结果表明,该模型的理论性是和实际应用一致的,具有一定的应用价值。

全文目录


摘要  3-4
Abstract  4-7
1 前言  7-15
  1.1 课题背景和意义  7-9
  1.2 国内外研究现状  9-13
  1.3 论文主要工作  13
  1.4 论文组织  13-15
2 基于PIM的SIMD体系结构  15-27
  2.1 基于PIM的并行结构  15-20
    2.1.1 DRAM参考模型  15-16
    2.1.2 存储空间分配  16-17
    2.1.3 PE结点结构  17-18
    2.1.4 控制器结构  18-19
    2.1.5 系统结构  19-20
  2.2 指令集体系结构  20-26
    2.2.1 数据类型  20
    2.2.2 寻址方式  20-21
    2.2.3 寄存器模型  21-22
    2.2.4 指令格式  22-23
    2.2.5 指令功能  23-24
      a.计算类指令  23-24
      b.控制类指令  24
    2.2.6 指令集  24-26
  2.3 小结  26-27
3 图像并行算法映射  27-36
  3.1 窗口灰度拉伸  27-28
  3.2 模板运算  28-31
  3.3 直方图运算  31-33
  3.4 快速傅里叶变换  33-35
  3.5 小结  35-36
4 体系结构建模  36-47
  4.1 系统建模  36-40
  4.2 流水线实现  40-42
  4.3 解码器  42-46
    4.3.1 指令周期  42
    4.3.2 译码和执行  42-46
      a.译码  42-45
      b.执行  45-46
  4.4 小结  46-47
5 编译器与集成环境  47-57
  5.1 目标文件  47-48
  5.2 汇编器  48-55
    5.2.1 词法分析  49-50
    5.2.2 语法分析  50-54
    5.2.3 符号表  54
    5.2.4 连接器  54-55
  5.3 界面设计  55-56
  5.4 小结  56-57
6 结论  57-59
致谢  59-60
参考文献  60-63
发表论文  63

相似论文

  1. 飞行器仿真器伺服系统控制及参数整定技术,V249.1
  2. 基于Cosim协同仿真的交换机芯片驱动开发,TN915.05
  3. 基于Cortex-A8平台的H.264解码器优化,TN919.81
  4. 基于蓝牙通信的汽车音响软件设计与实现,TN925
  5. 高性能低功耗多核处理器研究,TP332
  6. 虚拟机平台的设计与关键模块的实现,TP302
  7. 薄膜太阳能生产线自动化系统ACLS关键技术研究,TP278
  8. 实时随机SQL注入攻击检测方法的研究与应用,TP393.08
  9. 多目标指令集模拟器的设计与实现,TP391.9
  10. 基于显式通信指令集的分片式处理器模拟器开发,TP332
  11. 基于TTA可配置处理器的指令集仿真器及集成开发环境的设计,TP337
  12. FT-Matrix处理器指令集与指令派发设计,TP332
  13. ECC协处理器专用指令与可重构单元设计技术研究,TN918.2
  14. 基于FPGA的USB、Flash控制器设计,TN791
  15. 板级模拟电路仿真收敛性技术术究,TN710
  16. ARM体系结构虚拟化技术的研究与实现,TP368.1
  17. 基于OGRE的视景仿真系统研究,U268.4
  18. 面向图像处理的异构多核仿真系统研究,TP391.41
  19. 小学生看图作文思维模型培养研究,G623.2
  20. 基于OpenCL的神经网络BP算法研究及实现,TP183
  21. 加密专用处理器指令集设计,TP332

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机 > 并行计算机
© 2012 www.xueweilunwen.com