学位论文 > 优秀研究生学位论文题录展示
单目视频中的光流场估计技术研究
作 者: 廖彬
导 师: 杜明辉
学 校: 华南理工大学
专 业: 通信与信息系统
关键词: 光流估计 颜色模型 运动视频分割 光照辐射 大位移光流 彩色SIFT匹配
分类号: TP391.41
类 型: 博士论文
年 份: 2011年
下 载: 49次
引 用: 0次
阅 读: 论文下载
内容摘要
光流的概念最初来自于生物视觉研究,它描述了图像序列中可由视觉感知的运动,若由三维空间投影至二维图像平面,可近似表征为位移场。视觉感知研究发现,人类可通过运动直接识别周围环境,据此进行的自动导航试验也证明,以光流作为引导信息优于传统的导航方式。由于物体运动是视觉信息的主体,因此光流估计一直是计算机视觉及其相关研究领域的重要任务之一。光流的应用非常广泛,涉及了对象追踪、机器人学、人机交互、辅助驾驶、视频压缩、动态纹理分析、超分辨率等技术。基于亮度常量假设的BCM模型是使用最为广泛的光流模型,然而该模型的求解存在孔径问题,且该模型仅对不变光照下的朗伯体表面有效,这限制了光流技术的应用。为了提高光流估计的准确性与稳定性,着眼于特定应用的改进模型陆续出现。本文针对彩色视频的光流估计、光照改变时的光流计算、大位移运动的光流提取进行了研究,具体研究内容及创新成果如下:1.为能利用色彩信息提高光流估计的稳定性,本文从彩色光流场与色度空间的关系开始,对彩色光流场的颜色模型、估计原理、典型方法进行了分析比较,针对光流场计算,提出了线性规范化的知觉颜色模型。该颜色模型利用人眼知觉特性,使颜色像素间的差值对光照变化具有稳定性,并使颜色差值向量的范数与知觉距离相匹配。同时,通过线性规范化使得颜色分量间的相关性大为降低,为后续的彩色光流场求解提供了较好的估计条件。为进一步获得对视觉方向、表面方向、高光、环境光照变化不敏感的颜色空间,本文提出了基于线性规范化的知觉颜色比值模型。2.传统的光流估计是基于亮度或灰度等单色分量的,未充分利用彩色视频中丰富的颜色信息。光流是三维运动在二维平面上的投影,属于不适定问题,求解时需增加约束条件。若引入的辅助条件失效,则会引起大量光流误差。由于彩色图像中的某些颜色分量,在外界光照改变时,其稳定性优于亮度或灰度,因此可将颜色信息引入光流场计算,以提高估计质量。由此本文将构造的颜色空间与小区域平滑相结合,以色彩信息作为约束条件建立超定方程组,提出了扩展约束下的彩色光流方程法,实验结果表明,在实际摄录的视频中,本法获得的光流场质量优于同类方法。3.受现有的数值求解技术所限,光流矢量存在奇异点,且易在运动物体边界处过度平滑。为此,本文提出采用改进的自动彩色细胞生长分割法,将运动区域与背景相分离以获得较为精确且连续一致的运动边缘,其后分区域滤波以消除奇异点,从而降低光流场误差。4.基于图像亮度常量假设的模型其光流估计效果受光照影响较大,为克服此问题陆续出现了各种新模型,其中通用动态图像模型(GDIM)是影响较大、实用性较强的模型之一。本文通过对彩色图像序列的GDIM模型在克利福德代数域上的理论分析与推导,解释了GDIM模型中参数的物理意义,并根据推导结果对GDIM模型进行了修正。然后结合理论分析与实验数据,根据运动视觉产生的原理,提出了基于光照辐射的光流场模型,该模型将图像梯度场引入克利福德代数域,利用图像梯度场自身的方向特性及其对轮廓变化的敏感性,提高了光照改变时运动物体检测的准确度。5.高速运动在视频中体现为大位移变化。常规的光流模型线性化求解仅适用于小位移,此类方法通常要求位移幅度不超过单个像素。为提高大位移估计质量,本文在采用总变分分级对偶估计技术初步获得大位移光流矢量后,以基于多维点集的Hausdorff距离作为彩色SIFT描述子的匹配距离,调整图像序列中对应物上的光流,以大位移光流场的分级彩色SIFT匹配法保持光流细节,减少了光流估计误差。
|
全文目录
摘要 5-7 Abstract 7-12 第一章 绪论 12-20 1.1 研究意义和背景 12-14 1.2 光流场估计的研究内容 14-17 1.2.1 三维运动模型向二维几何图像的转换 14-15 1.2.2 光流场估计 15-16 1.2.3 光流场与运动场 16-17 1.3 本文主要研究内容与成果 17-19 1.4 本文的内容安排 19-20 第二章 光流场估计的相关技术 20-44 2.1 引言 20 2.2 光流场估计的研究现状 20-30 2.2.1 差分法 20-22 2.2.2 区域匹配法 22-23 2.2.3 能量法 23-24 2.2.4 相位法 24 2.2.5 彩色法 24-26 2.2.6 几何代数域法 26-27 2.2.7 与生物技术结合的方法 27-29 2.2.8 其他方法 29-30 2.3 光流场估计技术目前存在的主要问题 30-37 2.3.1 光流场估计的孔径问题 30-31 2.3.2 光流场估计中基本等式的不连续性 31-32 2.3.3 光流场估计在大位移下的准确度 32-33 2.3.4 遮挡区域对光流场估计的影响 33-36 2.3.5 光流场估计对光照变化的敏感性 36-37 2.4 光流场估计效果的评价 37-43 2.4.1 数值法 37-38 2.4.2 多面体运动检测 38-40 2.4.3 颜色编码法 40-42 2.4.4 大位移的评价方法 42-43 2.5 本章小结 43-44 第三章 彩色光流场估计 44-82 3.1 引言 44 3.2 彩色光流场估计技术简介 44-50 3.2.1 彩色光流场估计中的色度空间 44-49 3.2.2 彩色光流场估计典型方法 49-50 3.3 线性规范化的知觉颜色模型 50-58 3.3.1 知觉颜色模型 50-52 3.3.2 颜色模型的规范化 52-54 3.3.3 线性规范化的知觉颜色空间 54-56 3.3.4 基于线性规范化的知觉颜色比值模型 56-58 3.4 线性规范比值颜色模型上基于扩展约束的彩色光流场估计 58-65 3.4.1 光流场的扩展约束条件 58-59 3.4.2 基于扩展约束的彩色光流场 59-60 3.4.3 基于自动彩色细胞生长分割法的光流场细化 60-65 3.5 实验结果及分析 65-80 3.5.1 线性规范化的知觉颜色空间下的光流估计 65-72 3.5.2 基于线性规范化的知觉颜色比值模型下的光流估计 72-76 3.5.3 基于扩展约束的彩色光流场估计 76-79 3.5.4 应用自动彩色细胞生长分割进行的光流场细化 79-80 3.6 本章小结 80-82 第四章 基于光照辐射模型的光流场估计 82-96 4.1 引言 82 4.2 光照变化分析 82-85 4.2.1 朗伯反射模式 82-83 4.2.2 辐射度模型 83-84 4.2.3 白光下的反射模式 84-85 4.2.4 有色光下的反射模式 85 4.3 基于光照辐射的光流场模型 85-91 4.3.1 非恒定光照下的光流估计 85-86 4.3.2 克利福德代数域内彩色GDIM 光流场模型分析 86-88 4.3.3 基于光照辐射的光流场模型的建立 88-90 4.3.4 基于光照辐射的光流场模型的变分求解 90-91 4.4 实验 91-95 4.4.1 彩色方程组求解光流场 91-92 4.4.2 变分求解光流场 92-94 4.4.3 光照改变的光流场 94-95 4.5 本章小结 95-96 第五章 大位移光流场估计 96-115 5.1 引言 96 5.2 大位移光流场技术简介 96-100 5.2.1 大位移光流场的分级估计 97-99 5.2.2 大位移光流场的全局估计 99-100 5.3 大位移光流场的总变分分级对偶估计技术 100-102 5.4 大位移光流场的分级彩色SIFT 匹配 102-108 5.4.1 SIFT 技术发展简介 103-104 5.4.2 大位移光流场的分级彩色SIFT 匹配估计 104-108 5.5 实验 108-113 5.6 本章小结 113-115 总结 115-118 参考文献 118-142 攻读博士学位期间取得的研究成果 142-144 致谢 144-145 附表 145
|
相似论文
- 移动机器人视觉检测和跟踪研究,TP242.62
- 基于数字图像处理的手势识别,TP391.41
- 半自主足球机器人中彩色图像对光照不变性研究,TP391.41
- 基于真实场景的投影光照渲染,TP391.41
- 图像阴影的检测与去除算法研究,TP391.41
- 骨髓细胞图像分割方法研究,TP391.41
- 粒子滤波技术在工业缝纫机视频检测中的应用,TP391.41
- 基于特征点光流估计的运动目标跟踪算法理论及分析,TP391.41
- 基于颜色降维的彩色图像边缘检测研究,TP391.41
- 彩色图像的边缘检测研究,TP391.41
- 基于DSP/IP模块的林区火焰监控系统关键技术研究,TP277
- 车牌定位技术的研究与设计,TP391.41
- 复杂背景下的人脸检测研究,TP391.41
- RoboCup中型组足球机器人全景视觉系统的研究,TP242
- 彩色图像边缘检测算法研究,TP391.41
- 基于机器视觉系统的颜色识别研究,TP391.41
- 在矿山企业中图像处理技术新应用的初探,TP391.41
- 车牌识别系统中关键算法的研究与实现,TP391.41
- 地图制图中地貌晕渲实现技术的研究,P285.1
- 基于彩色直方图的交通检测系统,TP274.4
- 人脸图像中各器官的定位在计算机网络安全中的应用研究,TP393.08
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|