学位论文 > 优秀研究生学位论文题录展示

图像及图像序列上的交互抠图技术研究

作 者: 郝凯
导 师: 茅耀斌
学 校: 南京理工大学
专 业: 系统工程
关键词: 抠图技术 GrabCut Robust Matting 序列图像 时空GrabCut 人机交互
分类号: TP391.41
类 型: 硕士论文
年 份: 2012年
下 载: 98次
引 用: 1次
阅 读: 论文下载
 

内容摘要


抠图是一种通过掩膜图像从指定图像中分离出前景目标的技术。在影视制作、商业广告和家庭娱乐等领域有着广泛的应用。抠图为后期的图像合成提供相关素材,并决定合成效果,因此抠图技术一直是图像领域的研究热点之一。根据掩膜图像仅取值0、1还是取值0到1,抠图技术可分为0-1抠图和alpha抠图。本文实现了基于GrabCut的有监督0-1抠图算法,并研究了大尺寸图像上GrabCut计算量大的问题,给出了下采样和图像预分割两种改进方法。其中前者通过下采样图像上的两次小规模GrabCut替换原图上的一次大规模GrabCut,能够在不损失精度的情况下提高抠图速度。图像预分割方法以预分割的图像块代替单个像素生成映射图,降低了映射图的规模,从而有效地提高分割速度。对玻璃器皿等半透明物体或者毛发等细小目标,alpha抠图能够更好地分离混合的前景和背景,从而给出更逼真的图像合成效果。本文实现了基于alpha估计的Robust Matting方法,并针对Robust Matting中需要繁琐的人工交互制作三分图的问题,提出了基于0-1抠图的自动三分图生成。实验结果表明,自动生成三分图在不影响提取结果的前提下极大地减少了交互量。序列图像上的抠图虽然可以采用逐帧交互和处理的方式,但是计算量大,人工操作繁琐,效率低下。本文利用序列图像在时间轴上的邻域关系建立时空GrabCut,将n幅序列图像中的人机交互量由原来的n次减少到1次,交互量与单幅图像的抠图相当。同时针对整个序列在一次分割过程中存在的数据量大、对用户的修正操作响应速度慢等问题,本文提出采用k+1滑动窗的计算方式,用多次小规模的GrabCut替换一次大规模的GrabCut,从而加快用户信息反馈的速度。实验结果表明,k+1方式的时空GrabCut在简单背景和复杂背景的序列中都能给出令人满意的提取结果。

全文目录


摘要  3-4
Abstract  4-7
1 绪论  7-15
  1.1 研究背景及现状  7-13
    1.1.1 0-1 抠图技术  7-9
    1.1.2 alpha抠图技术  9-13
    1.1.3 序列图像中的0-1抠图  13
  1.2 论文主要工作  13-14
  1.3 论文内容安排  14-15
2 基于图的有监督0-1抠图  15-37
  2.1 基于图的图像分割  15-18
    2.1.1 图论中的相关概念  15-17
    2.1.2 网络中的最大流最小割  17-18
    2.1.3 图像到图的映射  18
  2.2 有监督的GrabCut算法  18-27
    2.2.1 GrabCut算法的实现  19-26
    2.2.2 GrabCut算法流程图  26-27
  2.3 GrabCut实验结果及分析  27-29
  2.4 下采样GrabCut  29-30
  2.5 预分割GrabCut  30-36
    2.5.1 分水岭变换  30-31
    2.5.2 预分割区域到图的映射  31-32
    2.5.3 预分割对GrabCut速度的影响  32-34
    2.5.4 预分割GrabCut的额外时间开销  34-36
  2.6 本章小结  36-37
3 基于透明度估计的alpha抠图  37-53
  3.1 alpha抠图技术  38-39
  3.2 Robust Matting抠图算法  39-47
    3.2.1 采样对的置信度  40-42
    3.2.2 初始alpha估计结果及分析  42-44
    3.2.3 优化初始估计的alpha值  44-45
    3.2.4 优化后的alpha估计结果及分析  45-47
  3.3 Robust Matting算法流程图  47-48
  3.4 有监督的Robust Matting  48-51
    3.4.1 自动三分图及实验结果  48-50
    3.4.2 自动三分图存在的问题  50-51
  3.5 本章小结  51-53
4 序列图像中的抠图技术  53-63
  4.1 序列图像上的前后帧信息关联  53-55
    4.1.1 图像特征提取及匹配  53-54
    4.1.2 实验结果分析  54-55
  4.2 时空GrabCut  55-58
    4.2.1 时空映射图  56-58
    4.2.2 基于滑动窗的时空GrabCut  58
  4.3 时空GrabCut流程图  58-59
  4.4 时空GrabCut实验结果及分析  59-62
  4.5 本章小结  62-63
5 总结与展望  63-65
  5.1 本文工作总结  63-64
  5.2 未来工作展望  64-65
致谢  65-67
参考文献  67-70

相似论文

  1. 数字电视互动应用交互系统设计与实现,TP311.52
  2. 全新的交互体验,TP11
  3. 基于DSP的双丝焊机及人机界面研究,TG409
  4. 家庭影视系统智能遥控器的设计及其交互方式研究,TP872
  5. 下一代广播电视网中有源EoC的人机交互系统的研究与实现,TP11
  6. 基于MTK平台双制式手机电视的研究与实现,TN929.53
  7. 基于深度图与彩色图像的跑步机游戏交互系统,TP391.41
  8. DALI住宅照明系统的工业设计,TM923
  9. 基于移动触摸屏的显示屏交互技术的研究与实现,TP334.3
  10. CADAL新型阅读体验研究,TP391.41
  11. 基于自然语言打印机人机交互方法研究与实现,TP11
  12. 图像修复的关键技术研究,TP391.41
  13. 电动车充电装置的人机交互设计研究,U469.72
  14. 人机交互环境下学术搜索功能学习的心智模型动态改变研究,G350
  15. 基于多点触控的大屏幕人机交互技术研究与应用,TP11
  16. 城市旅游电子地图交互式设计研究,P208
  17. 基于虚拟现实的水电机组检修培训技术研究,TV738
  18. 感官代偿在产品设计中的应用,TB472
  19. 基于中医理论的多路脉诊系统研制,R241.1
  20. 基于视觉的人体跟踪技术在人机交互中的应用,TP11

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com