学位论文 > 优秀研究生学位论文题录展示
3D视频编码中深度图的相关技术研究
作 者: 张涛
导 师: 高文
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 3D视频编码 多视点视频 视点合成 深度图 稀疏表示
分类号: TN919.81
类 型: 硕士论文
年 份: 2012年
下 载: 72次
引 用: 0次
阅 读: 论文下载
内容摘要
随着3D显示器和交互式多媒体系统的发展,新的3D视频应用,如三维电视(3DTV)和自由视点视频(FVV)已经越来越引起人们的兴趣。为了使这些3D视频应用成为可能,由多视点视频及其对应的深度图序列组成的新的3D视频格式(Multiview Video plus Depth,MVD)被提出。该视频格式利用基于深度图的视点合成技术(Depth Image Based Rendering,DIBR)可以合成任意位置的虚拟视点。如何对MVD数据进行高效的压缩是目前3D视频编码标准研究的一个重要问题。多视点视频在多视点视频编码标准(Multiview Video Coding,MVC)中已经进行了较详细的研究。本文主要对MVD中的深度图序列的编码和质量恢复进行了研究。深度图与传统的视频信息有很大的不同,深度图中的值表示的是场景中物体到摄像机的距离,它是由很有很多平滑区域构成,这些平滑区域由尖锐的边缘分隔开,而且这些边缘信息对视点合成非常敏感。此外,深度图不需要在终端呈现给用户进行观看,它主要是用来进行视点合成的。目前由于深度传感器物理上的限制,获取到的深度图通常具有很大程度的模糊和噪声,所以需要对深度图的质量进行复原。鉴于深度图的这些特性,本文提出了两项针对深度图编码的技术和一项针对深度图质量复原的技术。本文的主要工作和创新之处在于:1.提出了基于合成视点失真估计的深度图编码方法。本文充分分析了深度图编码对合成视点质量的影响,提出了用于深度图编码的失真模型。该失真模型用来估计深度编码对合成视点的影响。本文利用估计的合成视点失真来代替原有深度图失真进行RD最优化的模式决策过程。2.提出了基于视差的深度图编码方法。本文提出了对深度图对应的视差图进行编码来大幅度降低编码深度信息的码率,而对合成视点的质量没有较大的影响。该方法考虑了一种特殊的应用场合,即虚拟视点的位置在编码前已知。在目前的3D系统中虚拟视点的位置可以通过一个反馈网络得到,所以基于视差的深度图编码有着重要意义。3.提出了基于稀疏表示深度图恢复方法。该方法利用稀疏表示在图像逆问题中的重要作用,结合深度图像本身的一些先验知识:深度图中绝大部分区域是平滑的,深度图像中边缘与其对应的纹理图的边缘具有很强的相关性,对深度图进行恢复。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-23 1.1 课题背景及研究的目的和意义 9-11 1.2 3D 视频的研究现状 11-17 1.2.1 多视点视频编码 12-16 1.2.2 基于 MVD 的 3D 视频编码 16-17 1.3 深度图的编码和恢复研究现状 17-21 1.3.1 深度图的编码方法 18-20 1.3.2 深度图的复原方法 20-21 1.4 本文的主要研究内容及论文组织 21-23 第2章 基于合成视点失真估计的深度图编码 23-32 2.1 引言 23-24 2.2 深度值失真对合成视点几何失真的影响 24-25 2.3 基于视差舍入的几何失真模型 25-26 2.4 合成视点的失真估计模型 26-27 2.5 改进的深度图编码率失真模型 27-28 2.6 实验结果与分析 28-31 2.7 本章小结 31-32 第3章 基于视点视差的深度图编码 32-41 3.1 引言 32-33 3.2 1D 平行摄像机配置下视点合成分析 33-34 3.3 基于视差的深度图编码方法 34-36 3.4 基于视差的深度图编码的应用 36-37 3.5 实验结果与分析 37-39 3.6 本章小结 39-41 第4章 基于稀疏表示的深度图复原方法 41-56 4.1 引言 41 4.2 图像复原模型及稀疏表示理论 41-45 4.2.1 图像复原模型 42-43 4.2.2 稀疏表示理论 43-45 4.3 基于稀疏表示的深度图复原方法 45-50 4.3.1 基于自适应稀疏域选择(ASDS)的稀疏表示 45-48 4.3.2 基于 AR 模型的空间自适应的正则化 48-49 4.3.3 基于联合双边滤波(JBF)的正则化 49-50 4.3.4 本文提出算法的总结 50 4.4 实验结果与分析 50-55 4.5 本章小结 55-56 结论 56-57 参考文献 57-62 攻读学位期间发表的论文及其它成果 62-64 致谢 64
|
相似论文
- 分布式多视点视频编码容错边信息与相关噪声模型研究,TN919.81
- 语音信号的压缩感知研究及其在语音编码中的应用,TN912.3
- 多视点视频中视点绘制技术研究,TP391.41
- 多视点视频中的颜色校正方法研究,TP391.41
- 基于相关性的多视点视频编码,TN919.81
- 多视点视频编码预测结构评估与立体视频编码器优化,TN919.81
- 面向视觉传感器网络的目标定位与追踪研究,TP391.41
- 基于深度图与彩色图像的跑步机游戏交互系统,TP391.41
- 基于稀疏表示的高空间分辨率遥感影像纹理描述方法的研究,TP751
- 融合深度图和三维模型的人体运动捕捉技术研究,TP391.41
- 基于自适应字典稀疏表示超分辨率重建的视频编码技术,TN919.81
- 弱稀疏信号欠定盲分离技术的研究,TN911.7
- 可变光照和遮挡条件下的人脸识别技术研究及其应用,TP391.41
- 基于稀疏表示的人体运动捕获数据分析方法研究,TP391.41
- 基于内容的商品图像分类技术研究,TP391.41
- 基于稀疏表示的人脸图像识别方法研究,TP391.41
- 在线字典训练及加权差异性稀疏表示的研究,TP391.41
- 超复数稀疏表示及其应用的研究,TP391.41
- 基于图像稀疏表示的隐写算法研究,TP309
- 基于稀疏表示的杂波量化尺度研究,TN29
- 基于稀疏表示的脱机手写体汉字识别研究,TP391.1
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信 > 图像编码
© 2012 www.xueweilunwen.com
|