学位论文 > 优秀研究生学位论文题录展示
数字抠像技术的研究应用
作 者: 阳伟
导 师: 甘涛
学 校: 电子科技大学
专 业: 信号与信息处理
关键词: 蓝屏抠像 自然图像抠像 色度抠像 纹理聚类抠像 非线性编辑系统
分类号: TP391.41
类 型: 硕士论文
年 份: 2013年
下 载: 14次
引 用: 0次
阅 读: 论文下载
内容摘要
数字抠像(Digital matting)是指从图像或视频的背景中精确地分离出前景目标,是图像处理、非线性编辑和影视制作中的关键技术,也是计算机视觉领域的重要问题。根据是否对拍摄环境有条件限制,抠像技术可大致分为蓝屏抠像和自然图像抠像,他们的发展是一个历史演变过程。蓝屏抠像技术最早起源于电视电影制作,要求把前景目标置于某种已知颜色的背景前拍摄,常用的背景色有蓝色或绿色。颜色差异法、色度抠像和三角抠像法就是典型的蓝屏抠像方法。自然图像抠像技术对拍摄环境没有限制,适用于任意的自然图像,是近年来研究的热点。依据如何利用图像统计特性和近邻像素的相关性,自然图像抠像可以大致分为基于颜色采样和基于像素相似性传播两类技术。这些技术面临着两大技术难题:当前景和背景区域的颜色色阶重叠时,采样的样本像素不能对目标像素作一个可靠的表示;当图像的纹理比较丰富时,硬边使得近邻像素的相关性不能够准确地表示,阻碍了α从已知区域向未知区域的传播。本文的研究工作主要有三个方面:1.研究和实验了色度抠像算法,针对该算法的边沿问题,提出了一些改进方法。借鉴颜色差异法中颜色通道替换技术,结合膨胀腐蚀技术,改善了因色度溢出而产生的边沿问题。2.针对当把色度抠像应用到视频抠像中计算量大的问题,利用GPU的并行运算和高速浮点计算特性来对算法加速,成功地把色度抠像算法应用到非线性编辑系统中。3.在自然图像抠像中,针对图像纹理比较丰富时抠像难的问题,基于KNN抠像算法提出了一种纹理聚类抠像(TCM)算法。KNN抠像利用颜色和位置信息来获取近邻像素的相关性,在纹理丰富的区域表现不佳。TCM方法通过添加纹理特征,在新的特征空间聚类近邻像素以构建Laplacian,利用闭形解求解,克服了上述困难。在标准数据集上的实验结果验证了该算法能有效地提取出纹理丰富区域的前景目标。
|
全文目录
摘要 5-6 ABSTRACT 6-8 目录 8-10 第一章 绪论 10-16 1.1 研究背景 10-11 1.2 国内外研究现状和发展趋势 11-13 1.2.1 数学抠像问题 11 1.2.2 国内外研究现状 11-13 1.2.3 发展趋势 13 1.3 抠像质量的评价方法 13-14 1.4 本文的主要研究内容 14-16 第二章 数字抠像的基本原理和方法 16-30 2.1 蓝屏抠像 16-18 2.1.1 颜色差异法 17 2.1.2 三角抠像法 17-18 2.1.3 色度抠像法 18 2.2 自然图像抠像 18-28 2.2.1 基于颜色采样的技术 19-22 2.2.2 基于像素相似性传播的技术 22-28 2.3 小结 28-30 第三章 色度抠像算法的研究与改进 30-40 3.1 色度抠像 30-37 3.1.1 YCbCr 颜色空间 30-31 3.1.2 色度抠像算法 31-35 3.1.3 算法实现 35-37 3.2 算法改进 37-39 3.3 小结 39-40 第四章 色度抠像算法在非线性视频编辑中的应用 40-52 4.1 技术背景 40-46 4.1.1 非线性编辑 40 4.1.2 GPU 相关技术介绍 40-46 4.2 色度抠像算法的 GPU 实现 46-49 4.2.1 GPU 优化的可行性分析 46 4.2.2 实现流程框架 46-49 4.3 非线性编辑系统 49 4.4 实验分析 49-51 4.5 小结 51-52 第五章 基于纹理聚类的自然图像抠像算法 52-66 5.1 相关工作 52-54 5.2 基于纹理聚类的抠像方法 54-60 5.2.1 预备知识 54-55 5.2.2 纹理聚类抠像的总体框图 55-56 5.2.3 纹理特征提取 56-59 5.2.4 构造拉普拉斯 59 5.2.5 闭形式求解 59-60 5.3 实验结果分析 60-65 5.4 小结 65-66 第六章 总结与展望 66-68 6.1 工作总结 66-67 6.2 未来工作展望 67-68 致谢 68-69 参考文献 69-72 攻硕期间取得的研究成果 72-73
|
相似论文
- 基于CUDA的抠像算法设计优化,TP391.41
- 虚拟摄影棚资源制作系统研究与实现,TN948.1
- 媒体资产管理系统的设计与实现,TN948.6
- 非线性编辑系统中MPEG-4压缩——解压缩技术研究,TN919.81
- 高校教育技术专业中苹果计算机的应用研究,TP399
- 浅析非线性编辑系统对电影语言的丰富,J93
- 知识类电视节目的非线性创作研究,G222
- 可复用面向对象软件的设计模式,TP311.52
- 基于数字技术构建高校电视节目制作系统的研究与探讨,G432
- 基于DCT统计特性的视频蓝屏抠像合成检测,TP391.41
- 基于边缘特征的蓝屏抠像视频检测,TP391.41
- 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
- 用于检索的人脸特征提取与匹配算法研究,TP391.41
- 基于FPGA的高速图像预处理技术的研究,TP391.41
- 2D人脸模板保护算法研究,TP391.41
- 基于用户兴趣特征的图像检索研究与实现,TP391.41
- 图像拼接技术研究,TP391.41
- 高效精确字符串匹配算法的研究与实现,TP391.41
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 舌体特征的提取及融合分类方法研究,TP391.41
- 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|