学位论文 > 优秀研究生学位论文题录展示

基于GPU的自适应波束形成处理器研究

作 者: 杨旭
导 师: 盛卫星; 马晓峰
学 校: 南京理工大学
专 业: 通信与信息系统
关键词: GPU 并行计算 自适应波束形成处理器
分类号: TP391.41
类 型: 硕士论文
年 份: 2014年
下 载: 12次
引 用: 0次
阅 读: 论文下载
 

内容摘要


本文围绕大规模天线阵列自适应波束形成处理器的实时实现问题,探索如何采用基于图形处理器(GPU)的并行处理架构,改造现有的自适应波束形成算法,以提高自适应波束形成处理器实时处理能力。本文的主要工作包括:(1)分析了图形处理器(GPU)的硬件架构和并行处理的硬件、软件框架,介绍了CUDA (Compute Unified Device Architecture,统一计算设备架构)这一通用并行计算架构的特点和软件开发流程,并且尝试了在CUDA的软硬件环境下算法的并行处理方法。(2)根据GPU和CUDA的特点,对基于正交投影处理的自适应波束形成算法进行了改造,使其能在该硬件平台并行计算,完成了算法的优化编程,并在硬件平台上对算法进行了性能评估和测试。实验结果表明,针对相同的计算任务,采用基于GPU的改进的正交投影算法,同DSP相比,计算速度提高了10倍以上。(3)对快速降秩稳健最小方差自适应波束形成算法(FRRMVB)进行了改造,使其能在GPU加CUDA的硬件平台并行计算,完成了算法的优化编程,并在硬件平台上对算法进行了性能评估和测试。实验结果表明,针对相同的计算任务,采用基于GPU的改进的FRRMVB算法,同DSP相比,计算速度提高了一倍。(4)结合系统对自适应波束形成处理器的需要,提出了一种基于多GPU和FPGA的自适应波束形成处理器的实现方案,给出了具体的实现框图,并详细介绍了框图的组成部分,以及各部分的主要功能和主要接口,并给出了该自适应波束形成处理器中数据流的详细分析。

全文目录


摘要  3-4
Abstract  4-7
1 绪论  7-11
  1.1 研究历史背景和意义  7-8
  1.2 国内外研究动态  8-10
    1.2.1 DBF处理系统的研究动态  8
    1.2.2 GPU的研究动态  8-10
  1.3 本文的主要内容和安排  10-11
2 图形处理器硬件架构及其软件开发环境  11-25
  2.1 图形处理器及其硬件架构  11-12
  2.2 CUDA架构及其编程模型  12-19
    2.2.1 CUDA架构简介  12-13
    2.2.2 CUDA内核简介  13-14
    2.2.3 线程层次  14-15
    2.2.4 存储器层次  15-19
  2.3 CUDA的软件开发环境  19-22
  2.4 CUDA C并行编程  22-24
  2.5 本章小结  24-25
3 基于GPU的正交化算法的设计与优化编程实现  25-39
  3.1 正交化算法原理  25-26
  3.2 针对CUDA平台对正交化算法的改造  26-32
    3.2.1 基于CUDA的向量相乘函数的优化编程实现  26-28
    3.2.2 基于CUDA的复数向量相乘函数的优化编程实现  28-30
    3.2.3 基于CUDA的正交化算法的优化编程实现  30-32
  3.3 算法仿真及运算速度测试对比  32-38
    3.3.1 测试平台  32-34
    3.3.2 CUDA计时函数  34-35
    3.3.3 基于GPU和CPU的实数向量相乘运算速度测试对比  35-36
    3.3.4 优化前后的虚数向量相乘函数速度测试对比  36-37
    3.3.5 基于DSP和GPU的正交化算法仿真及速度测试对比  37-38
  3.4 本章小结  38-39
4 基GPU的FRRMVB算法的设计与优化编程实现  39-52
  4.1 FRRMVB算法原理  39-41
  4.2 针对CUDA平台对FRRMVB算法的改造  41-48
    4.2.1 基于CUDA的矩阵相乘函数的优化编程实现  41-44
    4.2.2 基于CUDA的矩阵求逆函数的优化编程实现  44-47
    4.2.3 基于CUDA的FRRMVB算法的优化编程实现  47-48
  4.3 算法仿真及运算速度测试对比  48-51
    4.3.1 基于CUDA的矩阵相乘函数速度测试对比  48-49
    4.3.2 基于CUDA的矩阵求逆函数速度测试对比  49-50
    4.3.3 基于DSP和GPU的FRRMVB算法仿真及速度测试对比  50-51
  4.4 章节小结  51-52
5 基于多GPU+FPGA的DBF处理器方案设计  52-62
  5.1 基于多GPU+FPGA的DBF处理器  52
  5.2 基于多GPU+FPGA的DBF处理器实现框架  52-60
    5.2.1 FPGA板卡  53-56
    5.2.2 GPU模块  56-58
    5.2.3 PCI-E总线背板  58-60
  5.3 基于多GPU+FPGA的DBF处理器中数据流分析  60-62
6 总结与展望  62-63
致谢  63-64
参考文献  64-66

相似论文

  1. 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
  2. 基于CUDA的图像数字水印技术的研究,TP309.7
  3. 基于MPI的三维地层建模和可视化方法研究,TP391.41
  4. CUDA平台下数字图像认证方法的设计与实现,TP391.41
  5. 基于GPU并行加速的正射影像生成研究,TP391.41
  6. 基于GPU的水下环境的实时模拟,TP391.41
  7. 数据流特征选择策略的研究,TP311.13
  8. 光学衍射场次级衍射的研究,O436.1
  9. 并发系统的并行计算及性能分析,TP338.6
  10. 基于神经网络与GPU的手写数字识别及其试卷管理,TP391.43
  11. 大规模二次规划相关算法的研究,O221.2
  12. 环境一号卫星CCD影像云去除方法研究及并行化实现,P228
  13. 基于GPU的BLAST程序的并行计算的研究,TP338.6
  14. 直接体绘制相关技术研究,TP391.41
  15. 基于GPU的医学图像体绘制算法的研究与实现,TP391.41
  16. 基于GPU的常见散列算法并行实现及优化,TP391.41
  17. 基于元胞自动机模型的硅各向异性腐蚀模拟,TB304
  18. GPU在车辆检测与跟踪系统中的应用研究,TP391.41
  19. 水稻分蘖断层图像重建加速研究,TP391.41
  20. 快速智能入侵检测技术研究,TP393.08
  21. 基于GPU的计算机断层成像技术研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com