学位论文 > 优秀研究生学位论文题录展示
基于GPU的自适应波束形成处理器研究
作 者: 杨旭
导 师: 盛卫星; 马晓峰
学 校: 南京理工大学
专 业: 通信与信息系统
关键词: GPU 并行计算 自适应波束形成处理器
分类号: TP391.41
类 型: 硕士论文
年 份: 2014年
下 载: 12次
引 用: 0次
阅 读: 论文下载
内容摘要
本文围绕大规模天线阵列自适应波束形成处理器的实时实现问题,探索如何采用基于图形处理器(GPU)的并行处理架构,改造现有的自适应波束形成算法,以提高自适应波束形成处理器实时处理能力。本文的主要工作包括:(1)分析了图形处理器(GPU)的硬件架构和并行处理的硬件、软件框架,介绍了CUDA (Compute Unified Device Architecture,统一计算设备架构)这一通用并行计算架构的特点和软件开发流程,并且尝试了在CUDA的软硬件环境下算法的并行处理方法。(2)根据GPU和CUDA的特点,对基于正交投影处理的自适应波束形成算法进行了改造,使其能在该硬件平台并行计算,完成了算法的优化编程,并在硬件平台上对算法进行了性能评估和测试。实验结果表明,针对相同的计算任务,采用基于GPU的改进的正交投影算法,同DSP相比,计算速度提高了10倍以上。(3)对快速降秩稳健最小方差自适应波束形成算法(FRRMVB)进行了改造,使其能在GPU加CUDA的硬件平台并行计算,完成了算法的优化编程,并在硬件平台上对算法进行了性能评估和测试。实验结果表明,针对相同的计算任务,采用基于GPU的改进的FRRMVB算法,同DSP相比,计算速度提高了一倍。(4)结合系统对自适应波束形成处理器的需要,提出了一种基于多GPU和FPGA的自适应波束形成处理器的实现方案,给出了具体的实现框图,并详细介绍了框图的组成部分,以及各部分的主要功能和主要接口,并给出了该自适应波束形成处理器中数据流的详细分析。
|
全文目录
摘要 3-4 Abstract 4-7 1 绪论 7-11 1.1 研究历史背景和意义 7-8 1.2 国内外研究动态 8-10 1.2.1 DBF处理系统的研究动态 8 1.2.2 GPU的研究动态 8-10 1.3 本文的主要内容和安排 10-11 2 图形处理器硬件架构及其软件开发环境 11-25 2.1 图形处理器及其硬件架构 11-12 2.2 CUDA架构及其编程模型 12-19 2.2.1 CUDA架构简介 12-13 2.2.2 CUDA内核简介 13-14 2.2.3 线程层次 14-15 2.2.4 存储器层次 15-19 2.3 CUDA的软件开发环境 19-22 2.4 CUDA C并行编程 22-24 2.5 本章小结 24-25 3 基于GPU的正交化算法的设计与优化编程实现 25-39 3.1 正交化算法原理 25-26 3.2 针对CUDA平台对正交化算法的改造 26-32 3.2.1 基于CUDA的向量相乘函数的优化编程实现 26-28 3.2.2 基于CUDA的复数向量相乘函数的优化编程实现 28-30 3.2.3 基于CUDA的正交化算法的优化编程实现 30-32 3.3 算法仿真及运算速度测试对比 32-38 3.3.1 测试平台 32-34 3.3.2 CUDA计时函数 34-35 3.3.3 基于GPU和CPU的实数向量相乘运算速度测试对比 35-36 3.3.4 优化前后的虚数向量相乘函数速度测试对比 36-37 3.3.5 基于DSP和GPU的正交化算法仿真及速度测试对比 37-38 3.4 本章小结 38-39 4 基GPU的FRRMVB算法的设计与优化编程实现 39-52 4.1 FRRMVB算法原理 39-41 4.2 针对CUDA平台对FRRMVB算法的改造 41-48 4.2.1 基于CUDA的矩阵相乘函数的优化编程实现 41-44 4.2.2 基于CUDA的矩阵求逆函数的优化编程实现 44-47 4.2.3 基于CUDA的FRRMVB算法的优化编程实现 47-48 4.3 算法仿真及运算速度测试对比 48-51 4.3.1 基于CUDA的矩阵相乘函数速度测试对比 48-49 4.3.2 基于CUDA的矩阵求逆函数速度测试对比 49-50 4.3.3 基于DSP和GPU的FRRMVB算法仿真及速度测试对比 50-51 4.4 章节小结 51-52 5 基于多GPU+FPGA的DBF处理器方案设计 52-62 5.1 基于多GPU+FPGA的DBF处理器 52 5.2 基于多GPU+FPGA的DBF处理器实现框架 52-60 5.2.1 FPGA板卡 53-56 5.2.2 GPU模块 56-58 5.2.3 PCI-E总线背板 58-60 5.3 基于多GPU+FPGA的DBF处理器中数据流分析 60-62 6 总结与展望 62-63 致谢 63-64 参考文献 64-66
|
相似论文
- 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
- 基于CUDA的图像数字水印技术的研究,TP309.7
- 基于MPI的三维地层建模和可视化方法研究,TP391.41
- CUDA平台下数字图像认证方法的设计与实现,TP391.41
- 基于GPU并行加速的正射影像生成研究,TP391.41
- 基于GPU的水下环境的实时模拟,TP391.41
- 数据流特征选择策略的研究,TP311.13
- 光学衍射场次级衍射的研究,O436.1
- 并发系统的并行计算及性能分析,TP338.6
- 基于神经网络与GPU的手写数字识别及其试卷管理,TP391.43
- 大规模二次规划相关算法的研究,O221.2
- 环境一号卫星CCD影像云去除方法研究及并行化实现,P228
- 基于GPU的BLAST程序的并行计算的研究,TP338.6
- 直接体绘制相关技术研究,TP391.41
- 基于GPU的医学图像体绘制算法的研究与实现,TP391.41
- 基于GPU的常见散列算法并行实现及优化,TP391.41
- 基于元胞自动机模型的硅各向异性腐蚀模拟,TB304
- GPU在车辆检测与跟踪系统中的应用研究,TP391.41
- 水稻分蘖断层图像重建加速研究,TP391.41
- 快速智能入侵检测技术研究,TP393.08
- 基于GPU的计算机断层成像技术研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|