学位论文 > 优秀研究生学位论文题录展示

基于GPU的图像粒子拟合及分类算法研究及应用

作 者: 张珩
导 师: 赵英;程勇
学 校: 北京化工大学
专 业: 计算机应用技术
关键词: GPU CUDA 高斯拟合 莱温伯格-马夸特 贝叶斯分类器
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 29次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着当代社会信息快速发展,每日在气象预报、计算生物学、商业风险计算、科学研究等领域产生海量的信息。基于x86体系结构的处理器由于元件的缩小和散热等工艺技术的限制,很难再有大的性能飞跃。为了应对海量数据问题,使用GPU来加速计算已成为一种趋势。在研究病毒中,为跟踪单点病毒粒子,会拍摄下大量的粒子图像。这些粒子的荧光图像在超显微镜下的亮度值呈点扩散函数形式。粒子的特征可以通过曲线拟合来得到。Levnberg-Marquardt算法是拟合曲线的一种稳定而快速的拟合方法。当拟合拍摄下的大量囊泡粒子图像时,这将是一个巨大的挑战。结合当前的GPU技术和拟合大量的粒子图像,本文基于CPU+GPU异构架构上做了如下贡献和工作:1,设计并实现了基于CPU+GPU架构的适用完整高斯函数、无角度高斯函数、圆形高斯函数等三种情形的GPU-GauseFitting并行程序。通过大量实验证明在拟合图像帧数大于1000的情况下,该GPU程序能够获得相对于串行程序CPU-GauseFitting 40倍以上的加速比。2,为了应对在拍摄中拍摄到两个囊泡的情况,对GPU-Gause Fitting进行可扩展性重构。扩展后的GPU-GauseFitting2程序更加具有普适性。通过大量实验证明在拟合图像帧数大于1000的情况下,该GPU程序能够获得相对于串行程序CPU-GauseFitting 60倍以上的加速比。3,设计并实现了基于CPU+GPU架构的并行朴素贝叶斯分类器(GPU-NBC)。使用该程序对拟合图像的结果数据进行分类,实验证明在数据量大于1000的情况下,结果显示能够获得相对于CPU-NBC 20倍左右的加速比。此外还使用本程序对来自UCI的10个以上的数据进行与CPU-NBC程序进行对比试验,获得了2-50倍的加速比。本文基于CPU+GPU异构架构实现的GPU-GauseFitting方法,能够快速的对图像数据进行拟合。同时GPU-NBC在数据分类中也能很好的起到加速作用。实验证明GPU不仅可用于高性能计算机中进行加速也适用于中小型实验室中的高性能计算。

全文目录


摘要  4-6
ABSTRACT  6-14
第一章 绪论  14-22
  1.1 课题研究背景及意义  14-15
  1.2 高性能计算需求概述  15-16
  1.3 高性能计算现状  16-19
  1.4 论文主要贡献  19
  1.5 论文组织结构  19-20
  1.6 本章小结  20-22
第二章 GPU多核计算模型  22-36
  2.1 Nvidia GPU发展简介  22-23
  2.2 CPU+GPU异构计算模型  23-24
  2.3 GPU硬件构架  24-25
    2.3.1 Nvidia显卡构造  24
    2.3.2 GPU芯片结构  24-25
  2.4 CUDA软件开发基础  25-35
    2.4.1 CUDA编程模型  26-30
    2.4.2 CUDA存储器模型  30-33
    2.4.3 CUDA共享与通信机制  33-34
    2.4.4 CUDA开发环境  34-35
  2.5 本章小结  35-36
第三章 基于GPU单粒子点扩散函数拟合算法  36-62
  3.1 问题来源及背景知识  36
  3.2 单粒子点扩展函数描述  36-37
  3.3 经典Levenberg-Marquardt(LM)算法  37-47
    3.3.1 LM算法基本原理  37-43
    3.3.2 LM算法分析与实现  43-47
  3.4 基于GPU的LM-GaussFitting算法实现  47-55
    3.4.1 GPU-GaussFitting并行设计策略  47-48
    3.4.2 GPU-GaussFitting内核函数设计  48-54
    3.4.3 GPU-GaussFitting并行算法实现  54-55
  3.5 试验结果比较与分析  55-60
    3.5.1 数据集说明  55-56
    3.5.2 GPU-GaussFitting实验结果  56-57
    3.5.3 实验结果比较与分析  57-60
  3.6 本章小结  60-62
第四章 基于GPU双粒子点扩散函数拟合算法  62-72
  4.1 问题来源及背景知识  62
  4.2 双粒子点扩展函数描述  62-66
  4.3 基于GPU的GaussFitting2算法实现  66-67
    4.3.1 GaussFitting2与GauseFitting的本质对比  66
    4.3.2 GPU-GauseFitting的可扩展性设计  66-67
  4.4 试验结果比较与分析  67-71
    4.4.1 数据集说明  67-68
    4.4.2 GPU-GaussFitting2实验结果  68-69
    4.4.3 实验结果比较与分析  69-71
  4.5 本章小结  71-72
第五章 基于GPU的粒子分类算法  72-82
  5.1 问题来源  72
  5.2 经典Naive Bayes分类器(NBC)  72-74
    5.2.1 CPU-NBC基本原理  72-74
    5.2.2 CPU-NBC实现与分析  74
  5.3 基于GPU的NBC算法实现  74-77
    5.3.1 GPU-NBC并行设计策略  74-75
    5.3.2 GPU-NBC内核函数设计  75-77
  5.4 试验结果比较与分析  77-80
    5.4.1 数据集说明  77-78
    5.4.2 GPU-NBC实验结果  78-79
    5.4.3 实验结果比较与分析  79-80
  5.5 本章小结  80-82
第六章 总结与展望  82-84
  6.1 总结  82-83
  6.2 展望  83-84
致谢  84-86
研究成果及发表的学术论文  86-88
作者和导师简介  88-90
参考文献  90-92
硕士研究生学位论文答辩委员会决议书  92-93

相似论文

  1. 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
  2. 基于GPU的有限元方法研究,O241.82
  3. 基于改进的非参数回归交通流量预测方法,F570
  4. 基于图形处理器的SIFT算法研究,TP391.41
  5. 基于CUDA的正则表达式匹配系统的设计与实现,TP311.52
  6. 基于GPU图像搜索中文本检索的关键技术研究,TP391.1
  7. 基于GPU/CPU多级并行CFD优化策略的研究,V221
  8. 基于GPGPU的快速白光干涉测量系统研究,O439
  9. 基于ffmpeg的高性能高清流媒体播放器软件设计,TN919.8
  10. 增强现实系统中火焰特效关键技术研究,TP391.9
  11. 基于多图形处理器的高效波动声学模拟器及其应用,TP391.41
  12. 群体仿真算法研究及疏散仿真系统开发,TP391.9
  13. GPU加速的粒子滤波PET图像重建算法,TP391.41
  14. 基于GPU的图书推荐系统研究与实现,TP391.3
  15. 基于GPU加速的一种线性规划算法及其应用,TP391.41
  16. 基于CUDA的视频火灾检测系统,TP391.41
  17. 基于GPU的时间序列并行检索算法研究,TP391.41
  18. 视频数据中人体动作的分类研究,TP391.41
  19. 基于CPU的源强反算算法研究,TP18
  20. 基于GPU的X射线重建算法加速研究,TP391.41
  21. 基于GPU加速的中性气体泄漏模拟与救援研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com