学位论文 > 优秀研究生学位论文题录展示

单目视频中的光流场估计技术研究

作 者: 廖彬
导 师: 杜明辉
学 校: 华南理工大学
专 业: 通信与信息系统
关键词: 光流估计 颜色模型 运动视频分割 光照辐射 大位移光流 彩色SIFT匹配
分类号: TP391.41
类 型: 博士论文
年 份: 2011年
下 载: 49次
引 用: 0次
阅 读: 论文下载
 

内容摘要


光流的概念最初来自于生物视觉研究,它描述了图像序列中可由视觉感知的运动,若由三维空间投影至二维图像平面,可近似表征为位移场。视觉感知研究发现,人类可通过运动直接识别周围环境,据此进行的自动导航试验也证明,以光流作为引导信息优于传统的导航方式。由于物体运动是视觉信息的主体,因此光流估计一直是计算机视觉及其相关研究领域的重要任务之一。光流的应用非常广泛,涉及了对象追踪、机器人学、人机交互、辅助驾驶、视频压缩、动态纹理分析、超分辨率等技术。基于亮度常量假设的BCM模型是使用最为广泛的光流模型,然而该模型的求解存在孔径问题,且该模型仅对不变光照下的朗伯体表面有效,这限制了光流技术的应用。为了提高光流估计的准确性与稳定性,着眼于特定应用的改进模型陆续出现。本文针对彩色视频的光流估计、光照改变时的光流计算、大位移运动的光流提取进行了研究,具体研究内容及创新成果如下:1.为能利用色彩信息提高光流估计的稳定性,本文从彩色光流场与色度空间的关系开始,对彩色光流场的颜色模型、估计原理、典型方法进行了分析比较,针对光流场计算,提出了线性规范化的知觉颜色模型。该颜色模型利用人眼知觉特性,使颜色像素间的差值对光照变化具有稳定性,并使颜色差值向量的范数与知觉距离相匹配。同时,通过线性规范化使得颜色分量间的相关性大为降低,为后续的彩色光流场求解提供了较好的估计条件。为进一步获得对视觉方向、表面方向、高光、环境光照变化不敏感的颜色空间,本文提出了基于线性规范化的知觉颜色比值模型。2.传统的光流估计是基于亮度或灰度等单色分量的,未充分利用彩色视频中丰富的颜色信息。光流是三维运动在二维平面上的投影,属于不适定问题,求解时需增加约束条件。若引入的辅助条件失效,则会引起大量光流误差。由于彩色图像中的某些颜色分量,在外界光照改变时,其稳定性优于亮度或灰度,因此可将颜色信息引入光流场计算,以提高估计质量。由此本文将构造的颜色空间与小区域平滑相结合,以色彩信息作为约束条件建立超定方程组,提出了扩展约束下的彩色光流方程法,实验结果表明,在实际摄录的视频中,本法获得的光流场质量优于同类方法。3.受现有的数值求解技术所限,光流矢量存在奇异点,且易在运动物体边界处过度平滑。为此,本文提出采用改进的自动彩色细胞生长分割法,将运动区域与背景相分离以获得较为精确且连续一致的运动边缘,其后分区域滤波以消除奇异点,从而降低光流场误差。4.基于图像亮度常量假设的模型其光流估计效果受光照影响较大,为克服此问题陆续出现了各种新模型,其中通用动态图像模型(GDIM)是影响较大、实用性较强的模型之一。本文通过对彩色图像序列的GDIM模型在克利福德代数域上的理论分析与推导,解释了GDIM模型中参数的物理意义,并根据推导结果对GDIM模型进行了修正。然后结合理论分析与实验数据,根据运动视觉产生的原理,提出了基于光照辐射的光流场模型,该模型将图像梯度场引入克利福德代数域,利用图像梯度场自身的方向特性及其对轮廓变化的敏感性,提高了光照改变时运动物体检测的准确度。5.高速运动在视频中体现为大位移变化。常规的光流模型线性化求解仅适用于小位移,此类方法通常要求位移幅度不超过单个像素。为提高大位移估计质量,本文在采用总变分分级对偶估计技术初步获得大位移光流矢量后,以基于多维点集的Hausdorff距离作为彩色SIFT描述子的匹配距离,调整图像序列中对应物上的光流,以大位移光流场的分级彩色SIFT匹配法保持光流细节,减少了光流估计误差。

全文目录


摘要  5-7
Abstract  7-12
第一章 绪论  12-20
  1.1 研究意义和背景  12-14
  1.2 光流场估计的研究内容  14-17
    1.2.1 三维运动模型向二维几何图像的转换  14-15
    1.2.2 光流场估计  15-16
    1.2.3 光流场与运动场  16-17
  1.3 本文主要研究内容与成果  17-19
  1.4 本文的内容安排  19-20
第二章 光流场估计的相关技术  20-44
  2.1 引言  20
  2.2 光流场估计的研究现状  20-30
    2.2.1 差分法  20-22
    2.2.2 区域匹配法  22-23
    2.2.3 能量法  23-24
    2.2.4 相位法  24
    2.2.5 彩色法  24-26
    2.2.6 几何代数域法  26-27
    2.2.7 与生物技术结合的方法  27-29
    2.2.8 其他方法  29-30
  2.3 光流场估计技术目前存在的主要问题  30-37
    2.3.1 光流场估计的孔径问题  30-31
    2.3.2 光流场估计中基本等式的不连续性  31-32
    2.3.3 光流场估计在大位移下的准确度  32-33
    2.3.4 遮挡区域对光流场估计的影响  33-36
    2.3.5 光流场估计对光照变化的敏感性  36-37
  2.4 光流场估计效果的评价  37-43
    2.4.1 数值法  37-38
    2.4.2 多面体运动检测  38-40
    2.4.3 颜色编码法  40-42
    2.4.4 大位移的评价方法  42-43
  2.5 本章小结  43-44
第三章 彩色光流场估计  44-82
  3.1 引言  44
  3.2 彩色光流场估计技术简介  44-50
    3.2.1 彩色光流场估计中的色度空间  44-49
    3.2.2 彩色光流场估计典型方法  49-50
  3.3 线性规范化的知觉颜色模型  50-58
    3.3.1 知觉颜色模型  50-52
    3.3.2 颜色模型的规范化  52-54
    3.3.3 线性规范化的知觉颜色空间  54-56
    3.3.4 基于线性规范化的知觉颜色比值模型  56-58
  3.4 线性规范比值颜色模型上基于扩展约束的彩色光流场估计  58-65
    3.4.1 光流场的扩展约束条件  58-59
    3.4.2 基于扩展约束的彩色光流场  59-60
    3.4.3 基于自动彩色细胞生长分割法的光流场细化  60-65
  3.5 实验结果及分析  65-80
    3.5.1 线性规范化的知觉颜色空间下的光流估计  65-72
    3.5.2 基于线性规范化的知觉颜色比值模型下的光流估计  72-76
    3.5.3 基于扩展约束的彩色光流场估计  76-79
    3.5.4 应用自动彩色细胞生长分割进行的光流场细化  79-80
  3.6 本章小结  80-82
第四章 基于光照辐射模型的光流场估计  82-96
  4.1 引言  82
  4.2 光照变化分析  82-85
    4.2.1 朗伯反射模式  82-83
    4.2.2 辐射度模型  83-84
    4.2.3 白光下的反射模式  84-85
    4.2.4 有色光下的反射模式  85
  4.3 基于光照辐射的光流场模型  85-91
    4.3.1 非恒定光照下的光流估计  85-86
    4.3.2 克利福德代数域内彩色GDIM 光流场模型分析  86-88
    4.3.3 基于光照辐射的光流场模型的建立  88-90
    4.3.4 基于光照辐射的光流场模型的变分求解  90-91
  4.4 实验  91-95
    4.4.1 彩色方程组求解光流场  91-92
    4.4.2 变分求解光流场  92-94
    4.4.3 光照改变的光流场  94-95
  4.5 本章小结  95-96
第五章 大位移光流场估计  96-115
  5.1 引言  96
  5.2 大位移光流场技术简介  96-100
    5.2.1 大位移光流场的分级估计  97-99
    5.2.2 大位移光流场的全局估计  99-100
  5.3 大位移光流场的总变分分级对偶估计技术  100-102
  5.4 大位移光流场的分级彩色SIFT 匹配  102-108
    5.4.1 SIFT 技术发展简介  103-104
    5.4.2 大位移光流场的分级彩色SIFT 匹配估计  104-108
  5.5 实验  108-113
  5.6 本章小结  113-115
总结  115-118
参考文献  118-142
攻读博士学位期间取得的研究成果  142-144
致谢  144-145
附表  145

相似论文

  1. 移动机器人视觉检测和跟踪研究,TP242.62
  2. 基于数字图像处理的手势识别,TP391.41
  3. 半自主足球机器人中彩色图像对光照不变性研究,TP391.41
  4. 基于真实场景的投影光照渲染,TP391.41
  5. 图像阴影的检测与去除算法研究,TP391.41
  6. 骨髓细胞图像分割方法研究,TP391.41
  7. 粒子滤波技术在工业缝纫机视频检测中的应用,TP391.41
  8. 基于特征点光流估计的运动目标跟踪算法理论及分析,TP391.41
  9. 基于颜色降维的彩色图像边缘检测研究,TP391.41
  10. 彩色图像的边缘检测研究,TP391.41
  11. 基于DSP/IP模块的林区火焰监控系统关键技术研究,TP277
  12. 车牌定位技术的研究与设计,TP391.41
  13. 复杂背景下的人脸检测研究,TP391.41
  14. RoboCup中型组足球机器人全景视觉系统的研究,TP242
  15. 彩色图像边缘检测算法研究,TP391.41
  16. 基于机器视觉系统的颜色识别研究,TP391.41
  17. 在矿山企业中图像处理技术新应用的初探,TP391.41
  18. 车牌识别系统中关键算法的研究与实现,TP391.41
  19. 地图制图中地貌晕渲实现技术的研究,P285.1
  20. 基于彩色直方图的交通检测系统,TP274.4
  21. 人脸图像中各器官的定位在计算机网络安全中的应用研究,TP393.08

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com