学位论文 > 优秀研究生学位论文题录展示

立体图像和视频编辑的研究

作 者: 晏涛
导 师: 黄刘生; 徐云
学 校: 中国科学技术大学
专 业: 计算机软件与理论
关键词: 立体(3D)图像和视频 图像编辑 深度映射 图像变形 图分割 多标签优化 立体图像拼接 立体全景图
分类号: TP391.41
类 型: 博士论文
年 份: 2013年
下 载: 61次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着3D电影“阿凡达”获得巨大成功,立体图像和视频在最近几年变得越来越流行。一幅立体(3D)图像由两幅通常的2D图像构成,这两幅2D图像是在同一时间从两个稍微不同的视点拍摄同一个场景获得的。当一幅立体图像/视频显示在屏幕上面的时候,观看者通过佩戴合适的观看设备,可以使得左眼只看到左视点的图像,右眼也只能看到右视点的图像。视觉系统将同时获得的左右视点图像传递到大脑以后,人类的大脑能够融合这两个稍微有差别的图像从而计算出3D场景的景深信息。因为立体图像能够传递更多的视觉信息,并且显示效果更加逼真,立体图像和视频被认为是图像和视频未来发展的主要方向。虽然存在大量的算法和软件工具可以处理2D图像/视频,但是可以拿来处理立体图/视频的工具却非常少。处理立体图像/视频要比处理2D图像/视频更加困难,主要有三个原因。首先,获取精确和没有噪声的视差图/深度图比较困难。立体匹配算法尝试计算不同试点间像素的对应关系。虽然经过了多年的研究,但是效果仍然不理想,尤其是计算复杂自然场景的视差图则结果更差。即使我们采用深度相机来获得现实场景的深度图,产生高分辨率和没有噪声的深度图像还是比较困难。原因是现有的深度相机产生的深度图像的分辨率很低,而且相机本身比较笨重和昂贵。其次,编辑立体图像时,保证左右视点图像的一致性关系比较困难。结果立体图像中左右视点图像的一致性对于最大限度的减少图像失真和产生高质量的结果极为重要。实际处理中,左右视点图像常常需要同时进行处理以确保实验结果中左右图像的一致性,例如左右图像同时放在一个全局优化算法中进行处理。可见立体图像/视频处理算法通常要比2D图像/视频处理算法要复杂,并且需要较高的计算开销和内存开销。再次,我们需要保证立体视频相邻帧之间运动和深度的一直性,以消除结果视频中相邻帧之间可能存在的抖动问题。在这篇论文中,我们讨论立体图像编辑面临的深层次问题,尝试解决这些技术困难来提供高效的立体图像/视频编辑算法。在论文中,我们主要提供以下三个立体图像和视频编辑的方法。首先,我们提出一种新的立体视频深度调整方法。目前几乎所有3D电影拍摄时主要考虑要适合在影院的大屏幕上面播放,观众离屏幕有一定的距离,以此来计算目标视频的深度范围。如果在3D电视,电脑屏幕或者手机上面播放这样的立体视频时,视频原有的深度范围将会被大大削减,会严重影响视频观看时的立体效果。这不利于立体图像和视频在尺寸比较小的数码移动设备中的传播和欣赏。因此,我们提出一种线性的深度映射方法来调整立体视频的深度范围。我们的方法根据立体视频播放时的观看参数来计算立体视频放映时实际深度范围,比如屏幕尺寸和分辨率,观看者到屏幕的距离。同时考虑人眼的立体视觉特征,例如图像中物体间相对深度对于人眼深度感知的重要性,人眼对直线,平面发生扭曲敏感性。我们提出的方法能够最小化图像内容的失真,主要是通过保护图像中相邻特征点之间的相对深度,防止图像中直线和平面的扭曲。我们的方法能够保护立体视频包含的三维场景空间结构,使其不会因为图像深度范围发生改变而被损坏。我们的方法还保护立体视频相邻帧之间深度和运动的一致性。深度一致性确保立体图像中物体在相邻视频帧之间深度的改变是平滑的。运动一致性的目的是确保左右视点相邻视频序列中物体的运动都是比较平滑的。实验结果显示我们的方法提升了立体视频的立体效果,能输出高质量的实验结果,使得图像失真最小化。其次,为了得到高质量的立体图深度映射和其他立体图像编辑效果,我们尝试拓展shift-map算法使之可以用来编辑立体图像。我们使用一个全局优化方法,能够在像素级同时处理左右视点图像。我们的方法确保左右视点图像的一致性,并且保护图像传递的3D场景结构信息。另外,我们的方法还可以解决遮挡和去除遮挡的问题,这使得我们的方法有能力解决很多立体图像的编辑问题,例如立体图像深度映射,立体图像中物体深度的调整和非均匀的图像尺寸缩放等。实验结果证明我们的方法具备的各种立体图像编辑功能均能产生高质量结果。再次,我们提出一种可以生成无限立体全景图的方法。无限立体全景图是指通过拼接图片来生成全景图像,并且通过不断拼接立体图像使得使全景图的宽度可以不断的延伸。这些用来进行拼接的立体图像描述相类似的场景,但是可能是在不同地理位置拍摄得到的。无限立体全景图可以被用来产生虚拟现实中非常有趣的游走场景等。生成无限立体全景图的一个最重要的问题是如何无缝的拼接两幅立体图像。尽管存在非常多的2D图像拼接方法,这些方法可能无法处理立体图像,原因是保证视差一致性可能会比较困难。在论文中,我们提出一种拼接立体图像的方法。我们首先用图分割算法来找到一对接缝,沿着这条接缝我们可以分别拼接左右视点图像。在计算这对接缝时,我们尽可能地使得拼接以后接缝两侧内容比较平滑,抑制可能产生的视觉错误。然后我们采用一个基于图像形变的视差调整算法来进一步抑制接缝两侧的图像深度跃变。我们的方法可以生成高质量的无限立体全景图,实验结果证明了我们提出的方法的有效性。

全文目录


摘要  5-8
Abstract  8-11
Table of Contents  11-14
Chapter 1 Introduction  14-22
  1.1 Research Motivation  14-15
  1.2 Background Knowledge  15-19
  1.3 Summary of Our Contribution  19-20
  1.4 Thesis Organization  20-22
Chapter 2 Reference Review  22-30
  2.1 Stereo Image and Video Recording  22-24
    2.1.1 Stereo Image and Video Capturing  23
    2.1.2 Panorama Stereo Image Capturing  23-24
  2.2 Stereo Image and Video Postprocessing  24-28
    2.2.1 Stereo Image and Video Editing  24-26
    2.2.2 Stereo Matching  26-27
    2.2.3 Urban Scene Reconstruction  27-28
  2.3 Image and Video 2D to 3D Conversion  28-30
Chapter 3 Depth Mapping for Stereo Videos  30-60
  3.1 Introduction  31-34
  3.2 Related Work  34-36
    3.2.1 Depth Adjustment During Video Capture  34-35
    3.2.2 Depth Post-Processing  35-36
  3.3 Overview of The Proposed Approach  36-38
  3.4 The Proposed Depth Mapping Model  38-40
  3.5 Stereoscopic Feature Preservation  40-46
    3.5.1 Depth Preservation of Neighboring Features  40-43
    3.5.2 Mesh Edge Preservation  43-44
    3.5.3 Line Preservation  44
    3.5.4 Plane Preservation  44-46
  3.6 Depth Coherence and Motion Coherence  46-50
    3.6.1 Depth Coherence  48-49
    3.6.2 Motion Coherence  49
    3.6.3 The Total Energy Term  49-50
  3.7 Experimental Results and Discussions  50-57
    3.7.1 User Study  52-57
    3.7.2 Limitations  57
  3.8 Conclusion  57-60
Chapter 4 Consistent Stereo Image Editing  60-76
  4.1 Introduction  60-61
  4.2 Related Work  61-63
    4.2.1 Continuous Methods  61-62
    4.2.2 Discrete Methods  62-63
  4.3 The Proposed Method  63-68
    4.3.1 Disparity Map Computation  64
    4.3.2 Data Cost  64
    4.3.3 Smooth Cost  64-65
    4.3.4 Photo Consistence  65-67
    4.3.5 3D Feature Preservation  67-68
  4.4 Results and Applications  68-69
  4.5 Conclusion and Future Work  69-76
Chapter 5 Generating Infinite Stereo Panoramas  76-92
  5.1 Introduction  76-78
  5.2 Related Work  78-81
    5.2.1 Stereo Image Editing  78-79
    5.2.2 2D Image Stiching  79-80
    5.2.3 Digital Panorama  80-81
  5.3 Stereo Image Stitching  81-86
    5.3.1 Seam Finding  81-84
    5.3.2 Warping-based Disparity Scaling  84-86
  5.4 Experimental Results and Discussions  86-87
  5.5 Conclusion and Future Work  87-92
Chapter 6 Conclusion  92-94
Appendix A  94-98
Appendix B  98-100
References  100-110
Acknowledgements  110-112
Publications  112-114
论文内容概要  114-119

相似论文

  1. 基于图分割的文本提取方法研究,TP391.41
  2. 远程交互教学活动中数字图像处理的研究与实施,TP391.41
  3. 基于样例的图像画质增强,TP391.41
  4. 基于显示调整与尺度变化的图像编辑,TP391.41
  5. 保持显著性的图像变形技术研究,TP391.41
  6. 基于笔画的图像色调调整,TP391.41
  7. 关于若干图类的编辑传播方法研究,TP391.41
  8. 基于子图分割和神经网络的人脸识别研究,TP391.41
  9. 基于内容自适应的数字图像修复算法研究,TP391.41
  10. 交互式人体形变和图像合成软件研究及实现,TP391.41
  11. 基于复杂网络的社团发现研究,O157.5
  12. 基于深度图像的变形分析方法研究,TP391.41
  13. 基于边界效应的立体视觉匹配研究,TP391.41
  14. 基于骨骼蒙皮的2D人体变形技术的设计与实现,TP391.41
  15. 基于多幅图像的鱼眼镜头标定方法研究,TP391.41
  16. 基于改进的MR-ASM的彩色人脸图像渐变研究,TP391.41
  17. 二维卡通画的渲染方法研究,TP391.41
  18. 视频对象分割与跟踪方法研究,TP391.41
  19. 基于视频的漫画人脸动画研究与实现,TP391.41
  20. 曲面网格骨架图的编辑与分割,O186.11
  21. 图像的三角化表示及其编辑,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com