学位论文 > 优秀研究生学位论文题录展示

基于关键帧混合建模的视频对象分割技术研究

作 者: 段炎彪
导 师: 朱松纯;贾云得
学 校: 北京理工大学
专 业: 计算机科学与技术
关键词: 关键帧 交互式视频分割 特征重合 混合模型 期望最大化 判别式学习
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 22次
引 用: 0次
阅 读: 论文下载
 

内容摘要


本文对视频对象分割问题的相关工作进行了分析总结,发现已有工作在视频对象分割问题中难以解决待分割对象和背景有特征重合的困难,针对这一问题,本文提出一种与像素位置相关,多分类器结合的统计模型。不同于之前已有的交互式视频对象分割算法,其简单地使用图像颜色信息建模,不考虑像素位置关系,本文提出的算法不仅使用像素点颜色特征,还利用了HSV空间颜色直方图和梯度直方图的丰富图像特征,并在期望最大化迭代的过程中,依赖判别式学习的方法,在用户标注的关键帧上训练出多个分类功能不同的分类器,而分类器对图像在不同区域的影响权重不同,这个权重是由本文引入的一个与像素位置相关的隐变量决定。这种算法框架利用了产生式建模和判别式学习的优势,能够处理前景物体和背景颜色重合、待分割对象边缘模糊以及帧间物体运动幅度较大的视频对象分割困难问题。为了能够把在关键帧上学习到的模型传导到没有用户标注的序列帧上,我们使用了基于特征点跟踪的方法来对模型中与位置分布有关的参数进行更新并使用基于最大流/最小割的图割方法来对分割结果进行优化求解。我们在大量的数据上进行实验测试,得到了较好的实验结果,与之前的方法比较,在一些困难的情景下取得了较好的效果。

全文目录


摘要  5-6
Abstract  6-9
第1章 绪论  9-16
  1.1 本论文研究的目的和意义  9-10
  1.2 国内外研究现状及发展趋势  10-15
    1.2.1 视频分割技术  10-12
    1.2.2 基于关键帧的视频分割技术的研究进展  12-15
  1.3 本论文研究内容及组织结构  15-16
    1.3.1 研究内容  15
    1.3.2 本论文的组织结构  15-16
第2章 基于混合模型的关键帧模型  16-22
  2.1 图像分割的定义及其在视频分割中的扩展  16-17
    2.1.1 图像分割定义  16
    2.1.2 视频分割定义  16-17
  2.2 混合高斯模型(GMM)及其在视频分割中的局限性  17-18
  2.3 基于混合模型的关键帧描述  18-22
第3章 关键帧模型学习  22-38
  3.1 EM 算法迭代学习模型参数  22-26
  3.2 Boosting 学习方法  26-30
    3.2.1 AdaBoost 算法概述  27-29
    3.2.2 AdaBoost 算法在本文模型中的应用  29-30
  3.3 模型参数的初始化  30-31
  3.4 特征设计  31-38
    3.4.1 图像特征概述  31-36
      3.4.1.1 颜色特征  32-34
      3.4.1.2 纹理特征  34-36
    3.4.2 本文的特征设计  36-38
第4章 利用时序连续信息的非关键帧模型更新  38-45
  4.1 非关键帧模型更新方法  38-42
  4.2 结合特征跟踪算法的模型自适应更新方法  42-45
    4.2.1 KLT 特征点跟踪算法概述  42-43
    4.2.2 结合KLT 算法的模型自适应更新  43-45
第5章 模型的优化求解  45-51
  5.1 待求解问题的描述  45-48
    5.1.1 阈值分割法  45-46
    5.1.2 基于区域的图像分割  46-47
    5.1.3 变分  47-48
  5.2 图割(Graph Cuts )  48-51
    5.2.1 图割基本理论  48-49
    5.2.2 图割在优化非关键帧分割结果中的应用  49-51
第6章 实验分析  51-56
结论  56-57
参考文献  57-60
攻读学位期间发表论文与研究成果清单  60-61
致谢  61

相似论文

  1. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  2. 虚拟人运动仿真研究,R318.0
  3. 基于加权投票和关键帧提取的视频流人脸识别方法研究,TP391.41
  4. 高质量语音转换系统中关键技术的研究,TN912.3
  5. 基于组合及统计的图像型垃圾邮件检测研究,TP391.41
  6. 多特征融合的视觉跟踪算法研究,TP391.41
  7. 虚拟手术系统中基于混合模型的切割仿真研究,TP391.41
  8. 视频分析中的镜头分割和目标跟踪研究,TP391.41
  9. 基于SARIMA与神经网络混合模型的桥梁健康监测系统缺失数据填补,TP183
  10. 基于非负矩阵分解的高光谱遥感图像混合像元分解研究,TP751.1
  11. 基于HMM-ANN混合模型的咳嗽音识别研究,TN912.34
  12. 推力转向喷流与高速主流干扰的数值模拟研究,V211.4
  13. 线性混合模型的参数估计,O212.1
  14. 无线传感器网络中的追击者—逃跑者跟踪问题研究,TP212.9
  15. 基于权重颜色分量和粒子群算法的视频检索方法的研究,TP391.41
  16. 基于SVG技术人物动画课件生成系统的设计与应用,TP391.41
  17. 新闻视频主题追踪技术研究,TP391.41
  18. 基于内容的新闻视频摘要技术研究,TP391.41
  19. 基于高校图书馆学术讲座视频的快速浏览技术研究,TP391.41
  20. 基于内容的县党政会议视频检索系统的实现,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com