学位论文 > 优秀研究生学位论文题录展示
立体图像和视频编辑的研究
作 者: 晏涛
导 师: 黄刘生; 徐云
学 校: 中国科学技术大学
专 业: 计算机软件与理论
关键词: 立体(3D)图像和视频 图像编辑 深度映射 图像变形 图分割 多标签优化 立体图像拼接 立体全景图
分类号: TP391.41
类 型: 博士论文
年 份: 2013年
下 载: 61次
引 用: 0次
阅 读: 论文下载
内容摘要
随着3D电影“阿凡达”获得巨大成功,立体图像和视频在最近几年变得越来越流行。一幅立体(3D)图像由两幅通常的2D图像构成,这两幅2D图像是在同一时间从两个稍微不同的视点拍摄同一个场景获得的。当一幅立体图像/视频显示在屏幕上面的时候,观看者通过佩戴合适的观看设备,可以使得左眼只看到左视点的图像,右眼也只能看到右视点的图像。视觉系统将同时获得的左右视点图像传递到大脑以后,人类的大脑能够融合这两个稍微有差别的图像从而计算出3D场景的景深信息。因为立体图像能够传递更多的视觉信息,并且显示效果更加逼真,立体图像和视频被认为是图像和视频未来发展的主要方向。虽然存在大量的算法和软件工具可以处理2D图像/视频,但是可以拿来处理立体图/视频的工具却非常少。处理立体图像/视频要比处理2D图像/视频更加困难,主要有三个原因。首先,获取精确和没有噪声的视差图/深度图比较困难。立体匹配算法尝试计算不同试点间像素的对应关系。虽然经过了多年的研究,但是效果仍然不理想,尤其是计算复杂自然场景的视差图则结果更差。即使我们采用深度相机来获得现实场景的深度图,产生高分辨率和没有噪声的深度图像还是比较困难。原因是现有的深度相机产生的深度图像的分辨率很低,而且相机本身比较笨重和昂贵。其次,编辑立体图像时,保证左右视点图像的一致性关系比较困难。结果立体图像中左右视点图像的一致性对于最大限度的减少图像失真和产生高质量的结果极为重要。实际处理中,左右视点图像常常需要同时进行处理以确保实验结果中左右图像的一致性,例如左右图像同时放在一个全局优化算法中进行处理。可见立体图像/视频处理算法通常要比2D图像/视频处理算法要复杂,并且需要较高的计算开销和内存开销。再次,我们需要保证立体视频相邻帧之间运动和深度的一直性,以消除结果视频中相邻帧之间可能存在的抖动问题。在这篇论文中,我们讨论立体图像编辑面临的深层次问题,尝试解决这些技术困难来提供高效的立体图像/视频编辑算法。在论文中,我们主要提供以下三个立体图像和视频编辑的方法。首先,我们提出一种新的立体视频深度调整方法。目前几乎所有3D电影拍摄时主要考虑要适合在影院的大屏幕上面播放,观众离屏幕有一定的距离,以此来计算目标视频的深度范围。如果在3D电视,电脑屏幕或者手机上面播放这样的立体视频时,视频原有的深度范围将会被大大削减,会严重影响视频观看时的立体效果。这不利于立体图像和视频在尺寸比较小的数码移动设备中的传播和欣赏。因此,我们提出一种线性的深度映射方法来调整立体视频的深度范围。我们的方法根据立体视频播放时的观看参数来计算立体视频放映时实际深度范围,比如屏幕尺寸和分辨率,观看者到屏幕的距离。同时考虑人眼的立体视觉特征,例如图像中物体间相对深度对于人眼深度感知的重要性,人眼对直线,平面发生扭曲敏感性。我们提出的方法能够最小化图像内容的失真,主要是通过保护图像中相邻特征点之间的相对深度,防止图像中直线和平面的扭曲。我们的方法能够保护立体视频包含的三维场景空间结构,使其不会因为图像深度范围发生改变而被损坏。我们的方法还保护立体视频相邻帧之间深度和运动的一致性。深度一致性确保立体图像中物体在相邻视频帧之间深度的改变是平滑的。运动一致性的目的是确保左右视点相邻视频序列中物体的运动都是比较平滑的。实验结果显示我们的方法提升了立体视频的立体效果,能输出高质量的实验结果,使得图像失真最小化。其次,为了得到高质量的立体图深度映射和其他立体图像编辑效果,我们尝试拓展shift-map算法使之可以用来编辑立体图像。我们使用一个全局优化方法,能够在像素级同时处理左右视点图像。我们的方法确保左右视点图像的一致性,并且保护图像传递的3D场景结构信息。另外,我们的方法还可以解决遮挡和去除遮挡的问题,这使得我们的方法有能力解决很多立体图像的编辑问题,例如立体图像深度映射,立体图像中物体深度的调整和非均匀的图像尺寸缩放等。实验结果证明我们的方法具备的各种立体图像编辑功能均能产生高质量结果。再次,我们提出一种可以生成无限立体全景图的方法。无限立体全景图是指通过拼接图片来生成全景图像,并且通过不断拼接立体图像使得使全景图的宽度可以不断的延伸。这些用来进行拼接的立体图像描述相类似的场景,但是可能是在不同地理位置拍摄得到的。无限立体全景图可以被用来产生虚拟现实中非常有趣的游走场景等。生成无限立体全景图的一个最重要的问题是如何无缝的拼接两幅立体图像。尽管存在非常多的2D图像拼接方法,这些方法可能无法处理立体图像,原因是保证视差一致性可能会比较困难。在论文中,我们提出一种拼接立体图像的方法。我们首先用图分割算法来找到一对接缝,沿着这条接缝我们可以分别拼接左右视点图像。在计算这对接缝时,我们尽可能地使得拼接以后接缝两侧内容比较平滑,抑制可能产生的视觉错误。然后我们采用一个基于图像形变的视差调整算法来进一步抑制接缝两侧的图像深度跃变。我们的方法可以生成高质量的无限立体全景图,实验结果证明了我们提出的方法的有效性。
|
全文目录
摘要 5-8 Abstract 8-11 Table of Contents 11-14 Chapter 1 Introduction 14-22 1.1 Research Motivation 14-15 1.2 Background Knowledge 15-19 1.3 Summary of Our Contribution 19-20 1.4 Thesis Organization 20-22 Chapter 2 Reference Review 22-30 2.1 Stereo Image and Video Recording 22-24 2.1.1 Stereo Image and Video Capturing 23 2.1.2 Panorama Stereo Image Capturing 23-24 2.2 Stereo Image and Video Postprocessing 24-28 2.2.1 Stereo Image and Video Editing 24-26 2.2.2 Stereo Matching 26-27 2.2.3 Urban Scene Reconstruction 27-28 2.3 Image and Video 2D to 3D Conversion 28-30 Chapter 3 Depth Mapping for Stereo Videos 30-60 3.1 Introduction 31-34 3.2 Related Work 34-36 3.2.1 Depth Adjustment During Video Capture 34-35 3.2.2 Depth Post-Processing 35-36 3.3 Overview of The Proposed Approach 36-38 3.4 The Proposed Depth Mapping Model 38-40 3.5 Stereoscopic Feature Preservation 40-46 3.5.1 Depth Preservation of Neighboring Features 40-43 3.5.2 Mesh Edge Preservation 43-44 3.5.3 Line Preservation 44 3.5.4 Plane Preservation 44-46 3.6 Depth Coherence and Motion Coherence 46-50 3.6.1 Depth Coherence 48-49 3.6.2 Motion Coherence 49 3.6.3 The Total Energy Term 49-50 3.7 Experimental Results and Discussions 50-57 3.7.1 User Study 52-57 3.7.2 Limitations 57 3.8 Conclusion 57-60 Chapter 4 Consistent Stereo Image Editing 60-76 4.1 Introduction 60-61 4.2 Related Work 61-63 4.2.1 Continuous Methods 61-62 4.2.2 Discrete Methods 62-63 4.3 The Proposed Method 63-68 4.3.1 Disparity Map Computation 64 4.3.2 Data Cost 64 4.3.3 Smooth Cost 64-65 4.3.4 Photo Consistence 65-67 4.3.5 3D Feature Preservation 67-68 4.4 Results and Applications 68-69 4.5 Conclusion and Future Work 69-76 Chapter 5 Generating Infinite Stereo Panoramas 76-92 5.1 Introduction 76-78 5.2 Related Work 78-81 5.2.1 Stereo Image Editing 78-79 5.2.2 2D Image Stiching 79-80 5.2.3 Digital Panorama 80-81 5.3 Stereo Image Stitching 81-86 5.3.1 Seam Finding 81-84 5.3.2 Warping-based Disparity Scaling 84-86 5.4 Experimental Results and Discussions 86-87 5.5 Conclusion and Future Work 87-92 Chapter 6 Conclusion 92-94 Appendix A 94-98 Appendix B 98-100 References 100-110 Acknowledgements 110-112 Publications 112-114 论文内容概要 114-119
|
相似论文
- 基于图分割的文本提取方法研究,TP391.41
- 远程交互教学活动中数字图像处理的研究与实施,TP391.41
- 基于样例的图像画质增强,TP391.41
- 基于显示调整与尺度变化的图像编辑,TP391.41
- 保持显著性的图像变形技术研究,TP391.41
- 基于笔画的图像色调调整,TP391.41
- 关于若干图类的编辑传播方法研究,TP391.41
- 基于子图分割和神经网络的人脸识别研究,TP391.41
- 基于内容自适应的数字图像修复算法研究,TP391.41
- 交互式人体形变和图像合成软件研究及实现,TP391.41
- 基于复杂网络的社团发现研究,O157.5
- 基于深度图像的变形分析方法研究,TP391.41
- 基于边界效应的立体视觉匹配研究,TP391.41
- 基于骨骼蒙皮的2D人体变形技术的设计与实现,TP391.41
- 基于多幅图像的鱼眼镜头标定方法研究,TP391.41
- 基于改进的MR-ASM的彩色人脸图像渐变研究,TP391.41
- 二维卡通画的渲染方法研究,TP391.41
- 视频对象分割与跟踪方法研究,TP391.41
- 基于视频的漫画人脸动画研究与实现,TP391.41
- 曲面网格骨架图的编辑与分割,O186.11
- 图像的三角化表示及其编辑,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|