学位论文 > 优秀研究生学位论文题录展示
多视图图像的快速三维场景重建
作 者: 田文
导 师: 王宏远
学 校: 华中科技大学
专 业: 信息与通信工程
关键词: 从运动恢复结构 多视图重建 特征提取与匹配 尺度不变特征变换 图形处理器 统一计算设备架构 局部敏感哈希 随机抽样一致性算法
分类号: TP391.41
类 型: 博士论文
年 份: 2010年
下 载: 394次
引 用: 0次
阅 读: 论文下载
内容摘要
多视图重建是计算机视觉领域的一个基本问题,有着广泛的应用前景。本文研究的问题是如何高效率的实现大规模的多视图重建,随着输入视图数量的增多,完成重建所需要的计算量和时间会快速增长。经过理论分析和实验证明,一个大规模的多视图重建系统的性能瓶颈主要在于如下的两个环节:(1)特征的提取与匹配;(2)多视图几何约束关系的计算。作为多视图重建的开始,首先需要对输入的每幅视图提取特征点,随后再在两两视图之间计算特征匹配;这一步骤所需的计算量会随着输入视图的增加呈平方等级的增长。另外多视图几何约束关系也是需要在两两视图之间计算,因此随着输入视图数的增多,这一步骤的计算量也会快速增长;如何在追求高效的同时兼顾算法的精度与鲁棒性,也是本文需要考虑的问题。特征提取方面,提出了一种适合图形处理器(GPU)加速计算的并行尺度不变特征变换(SIFT)算法;针对SIFT算法的各个步骤进行了详细的复杂度分析和并行化处理。实验证明,本文算法在640×480的图像分辨率下每秒完成28帧图像的特征提取,在不影响算法精度的前提下相比CPU算法加速比超过了30倍,相比现有的GPU算法加速比达到了1.5倍以上。特征匹配方面,提出了一种基于局部敏感哈希(LSH)的多视图特征匹配方法;不同于现有算法基于两两视图间局部匹配的策略,本文算法基于数据库索引的思想提出了一种全局匹配算法;并针对SIFT特征描述子的数据特性,使用超球面划分和随机K维查找树划分对LSH算法进行了改进。实验证明,本文算法在降低匹配精度9%到20%的情况下相对线性算法速度提升到了2.9至7.8倍。多视图几何约束关系计算方面,提出了一种新算法LO-MLESAC;通过在随机抽样一致的策略中加入局部优化和最大似然估计,实现了基础矩阵的快速高精度的计算。另外,在多视图两两关系计算中,通过对循环次数和运行时间的限制,快速去除了匹配度低的视图对。实验证明,本文算法在输出局内点点数减少不超过5%的基础上算法速度提升到了原有算法的2.4到3.1倍。
|
全文目录
摘要 4-6 Abstract 6-8 目录 8-10 1 绪论 10-24 1.1 研究背景 11-14 1.2 本文组织与创新点 14-24 2 多视图重建系统分析 24-50 2.1 多视图几何学 24-37 2.2 特征提取 37-44 2.3 高维空间下的最近邻搜索 44-46 2.4 随机抽样一致性算法 46-48 2.5 本章小结 48-50 3 快速特征提取 50-80 3.1 问题描述 50 3.2 SIFT特征提取 50-55 3.3 特征提取的快速算法 55-61 3.4 SIFT算法复杂度及可并行性分析 61-63 3.5 基于CUDA的SIFT快速并行算法 63-74 3.6 实验结果 74-79 3.7 本章小结 79-80 4 快速多视图特征匹配 80-98 4.1 问题描述 80-81 4.2 似最近邻搜索 81-85 4.3 基于LSH的快速多视图特征匹配 85-92 4.4 实验结果 92-96 4.5 本章小结 96-98 5 快速双视图几何关系计算 98-110 5.1 问题描述 98 5.2 最大似然抽样一致算法 98-100 5.3 局部优化快速MLESAC算法 100-103 5.4 快速局外点过滤 103-105 5.5 实验结果 105-109 5.6 本章小结 109-110 6 系统实验 110-120 6.1 实验数据 110-111 6.2 实验配置 111-114 6.3 实验结果 114-118 6.4 本章小结 118-120 7 总结与展望 120-122 7.1 本文的研究成果与创新点 120-121 7.2 研究展望 121-122 致谢 122-124 参考文献 124-132 附录1 攻读学位期间发表的学术论文 132
|
相似论文
- 基于多核计算平台的视频压缩算法研究,TN919.81
- 基于CUDA架构的H.264并行计算研究,TN919.81
- 裸眼三维增强现实关键技术研究,TP391.41
- Web图像搜索中基于GPU的图像分割技术术究,TP391.41
- 基于SIFT的数字水印算法研究,TP309.7
- 流体场景的屏幕空间实时绘制研究,TP391.41
- 基于多幅图像的几何和纹理自动重建,TP391.41
- 立体视觉三维重建相关技术研究与实现,TP391.41
- 基于GPU的H.264到AVS视频转码并行设计,TN919.81
- 虹膜识别关键技术的研究,TP391.41
- H.264并行编码算法设计及其在GPU上的实现,TP391.41
- 基于DSP的单目视觉定位方法关键技术研究,TP391.41
- 单张图像去雾研究,TP391.41
- 基于哼唱的音乐检索系统,TN912.3
- 基于高性能计算的脑电信号分析,R318.0
- 基于GPU的密码算法实现技术研究,TP393.08
- 基于FPGA的3D图形处理器IP核的设计与实现,TP391.41
- 基于计算机视觉的三维重建技术研究,TP391.41
- LMCCD影像像点自动量测技术研究,TP391.41
- 基于GPU的医学图像三维重建算法及其应用,TP391.41
- 基于GPU的程序分析与并行化研究,TP332
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|