学位论文 > 优秀研究生学位论文题录展示
图像及图像序列上的交互抠图技术研究
作 者: 郝凯
导 师: 茅耀斌
学 校: 南京理工大学
专 业: 系统工程
关键词: 抠图技术 GrabCut Robust Matting 序列图像 时空GrabCut 人机交互
分类号: TP391.41
类 型: 硕士论文
年 份: 2012年
下 载: 98次
引 用: 1次
阅 读: 论文下载
内容摘要
抠图是一种通过掩膜图像从指定图像中分离出前景目标的技术。在影视制作、商业广告和家庭娱乐等领域有着广泛的应用。抠图为后期的图像合成提供相关素材,并决定合成效果,因此抠图技术一直是图像领域的研究热点之一。根据掩膜图像仅取值0、1还是取值0到1,抠图技术可分为0-1抠图和alpha抠图。本文实现了基于GrabCut的有监督0-1抠图算法,并研究了大尺寸图像上GrabCut计算量大的问题,给出了下采样和图像预分割两种改进方法。其中前者通过下采样图像上的两次小规模GrabCut替换原图上的一次大规模GrabCut,能够在不损失精度的情况下提高抠图速度。图像预分割方法以预分割的图像块代替单个像素生成映射图,降低了映射图的规模,从而有效地提高分割速度。对玻璃器皿等半透明物体或者毛发等细小目标,alpha抠图能够更好地分离混合的前景和背景,从而给出更逼真的图像合成效果。本文实现了基于alpha估计的Robust Matting方法,并针对Robust Matting中需要繁琐的人工交互制作三分图的问题,提出了基于0-1抠图的自动三分图生成。实验结果表明,自动生成三分图在不影响提取结果的前提下极大地减少了交互量。序列图像上的抠图虽然可以采用逐帧交互和处理的方式,但是计算量大,人工操作繁琐,效率低下。本文利用序列图像在时间轴上的邻域关系建立时空GrabCut,将n幅序列图像中的人机交互量由原来的n次减少到1次,交互量与单幅图像的抠图相当。同时针对整个序列在一次分割过程中存在的数据量大、对用户的修正操作响应速度慢等问题,本文提出采用k+1滑动窗的计算方式,用多次小规模的GrabCut替换一次大规模的GrabCut,从而加快用户信息反馈的速度。实验结果表明,k+1方式的时空GrabCut在简单背景和复杂背景的序列中都能给出令人满意的提取结果。
|
全文目录
摘要 3-4 Abstract 4-7 1 绪论 7-15 1.1 研究背景及现状 7-13 1.1.1 0-1 抠图技术 7-9 1.1.2 alpha抠图技术 9-13 1.1.3 序列图像中的0-1抠图 13 1.2 论文主要工作 13-14 1.3 论文内容安排 14-15 2 基于图的有监督0-1抠图 15-37 2.1 基于图的图像分割 15-18 2.1.1 图论中的相关概念 15-17 2.1.2 网络中的最大流最小割 17-18 2.1.3 图像到图的映射 18 2.2 有监督的GrabCut算法 18-27 2.2.1 GrabCut算法的实现 19-26 2.2.2 GrabCut算法流程图 26-27 2.3 GrabCut实验结果及分析 27-29 2.4 下采样GrabCut 29-30 2.5 预分割GrabCut 30-36 2.5.1 分水岭变换 30-31 2.5.2 预分割区域到图的映射 31-32 2.5.3 预分割对GrabCut速度的影响 32-34 2.5.4 预分割GrabCut的额外时间开销 34-36 2.6 本章小结 36-37 3 基于透明度估计的alpha抠图 37-53 3.1 alpha抠图技术 38-39 3.2 Robust Matting抠图算法 39-47 3.2.1 采样对的置信度 40-42 3.2.2 初始alpha估计结果及分析 42-44 3.2.3 优化初始估计的alpha值 44-45 3.2.4 优化后的alpha估计结果及分析 45-47 3.3 Robust Matting算法流程图 47-48 3.4 有监督的Robust Matting 48-51 3.4.1 自动三分图及实验结果 48-50 3.4.2 自动三分图存在的问题 50-51 3.5 本章小结 51-53 4 序列图像中的抠图技术 53-63 4.1 序列图像上的前后帧信息关联 53-55 4.1.1 图像特征提取及匹配 53-54 4.1.2 实验结果分析 54-55 4.2 时空GrabCut 55-58 4.2.1 时空映射图 56-58 4.2.2 基于滑动窗的时空GrabCut 58 4.3 时空GrabCut流程图 58-59 4.4 时空GrabCut实验结果及分析 59-62 4.5 本章小结 62-63 5 总结与展望 63-65 5.1 本文工作总结 63-64 5.2 未来工作展望 64-65 致谢 65-67 参考文献 67-70
|
相似论文
- 数字电视互动应用交互系统设计与实现,TP311.52
- 全新的交互体验,TP11
- 基于DSP的双丝焊机及人机界面研究,TG409
- 家庭影视系统智能遥控器的设计及其交互方式研究,TP872
- 下一代广播电视网中有源EoC的人机交互系统的研究与实现,TP11
- 基于MTK平台双制式手机电视的研究与实现,TN929.53
- 基于深度图与彩色图像的跑步机游戏交互系统,TP391.41
- DALI住宅照明系统的工业设计,TM923
- 基于移动触摸屏的显示屏交互技术的研究与实现,TP334.3
- CADAL新型阅读体验研究,TP391.41
- 基于自然语言打印机人机交互方法研究与实现,TP11
- 图像修复的关键技术研究,TP391.41
- 电动车充电装置的人机交互设计研究,U469.72
- 人机交互环境下学术搜索功能学习的心智模型动态改变研究,G350
- 基于多点触控的大屏幕人机交互技术研究与应用,TP11
- 城市旅游电子地图交互式设计研究,P208
- 基于虚拟现实的水电机组检修培训技术研究,TV738
- 感官代偿在产品设计中的应用,TB472
- 基于中医理论的多路脉诊系统研制,R241.1
- 基于视觉的人体跟踪技术在人机交互中的应用,TP11
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|