学位论文 > 优秀研究生学位论文题录展示
视频编码增强预测及后处理的研究
作 者: 辛国山
导 师: 高文
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 视频编码 混合预测编码 去块效应 K-SVD 稀疏表示
分类号: TN919.81
类 型: 硕士论文
年 份: 2011年
下 载: 13次
引 用: 0次
阅 读: 论文下载
内容摘要
进入21世纪以来,人们加快了高科技发展的步伐,人们生活中,视频聊天、视频会议、网络电视、高清电视等已经非常普遍,这些应用导致了巨大的视频数据,对存储以及网络传输构成了极大的挑战。视频编码或视频压缩就是解决这一挑战的一个极其重要的技术。视频编码的主要目标就是减少描述视频所需的数据量,同时保持视频的视觉质量。历经半世纪的研究发展,视频编码技术已经形成了以预测编码、变换量化编码、熵编码为核心的混合编码框架。作为视频编码一大核心技术,预测编码对视频编码的性能有很大的贡献,其基本思想是利用相关性通过已编码重构信号对待编码信号进行预测,然后对残差信号编码。目前视频编码的预测编码技术有基于空间相关性的帧内预测和基于时间相关性的帧间预测,二者都是基于单一相关性的预测。本文对基于时空相关性的帧间帧内混合预测编码进行深入研究。距离越近空间相关性越强,平滑区域的相邻区域也很可能是平滑的,基于上述两大思想本文提出新颖的混合预测策略。如果当前块的最佳预测模式是帧间预测模式,则启动时空混合预测模式,将当前块划分为帧内预测区域和帧间预测区域,其中帧内预测区域靠近参考块。论文通过模拟证实帧间帧内混合预测编码能获得更佳的编码性能,其关键问题是额外模式信息比特的消除以及帧间帧内权值的确定。虽然视频编码能够极大减少视频信号所需的比特数,但由于视频压缩中基于块的量化,视频帧会遭受一些退化,比较主要有块效应以及边缘震荡效应。块效应对于人眼来说比较敏感,因此,一个高效的去块效应算法非常有必要。经过多年的研究,目前有很多高效的压缩视频去块效应算法,例如视频编码标准中非常成熟的环路滤波。K奇异值分解(K-Singular Value Decomposition, K-SVD)图像去块效应算法是基于自适应过完备字典的信号稀疏表示来去块效应,而且其性能优于其他图形去块效应算法。本文结合K-SVD算法和视频压缩的信息提出了基于自适应过完备字典稀疏表示的压缩视频去块效应算法。K-SVD算法是个迭代过程,每个过程分为两个阶段:基于当前已知字典对信号进行稀疏表示,然后更新字典同时更新稀疏表示的系数。论文通过实验证明该算法在主客观评价标准都得到了很大的提升,对于I帧PSNR提高0.4dB左右。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-18 1.1 研究背景及意义 9-12 1.2 压缩视频后处理概述 12-13 1.3 时空混合预测研究现状 13-14 1.4 压缩视频去块效应研究现状 14-17 1.4.1 环路滤波 15 1.4.2 单一帧去块效应 15-17 1.5 研究内容及组织结构 17-18 第2章 预测编码技术 18-27 2.1 帧内预测 20-23 2.1.1 4x4 亮度预测模式 20-21 2.1.2 16x16 亮度预测模式 21-22 2.1.3 帧内预测模式选择 22-23 2.2 帧间预测 23-26 2.2.1 运动补偿 24-25 2.2.2 运动估计 25 2.2.3 运动向量预测 25-26 2.2.4 帧间预测模式选择 26 2.3 本章小结 26-27 第3章 基于时空相关性的帧间帧内混合预测 27-35 3.1 时空混合预测编码策略 28-29 3.2 实验结果及分析 29-34 3.3 本章小结 34-35 第4章 压缩视频去块效应 35-47 4.1 压缩失真 35-36 4.2 信号稀疏表示 36-38 4.3 K-SVD 算法 38-39 4.4 K-SVD 压缩图像去块效应 39 4.5 K-SVD 压缩视频去块效应 39-40 4.6 实验结果及分析 40-46 4.6.1 全I 帧GOP 实验 41-43 4.6.2 IBP GOP 实验 43-46 4.7 本章小结 46-47 结论 47-48 参考文献 48-52 攻读工学硕士学位期间发表的论文及其它成果 52-54 致谢 54
|
相似论文
- 基于分布式视频编码错误消除机制的研究与实现,TN919.81
- 语音信号的压缩感知研究及其在语音编码中的应用,TN912.3
- 分布式视频编码边信息生成研究,TN919.81
- 基于稀疏表示残差融合的人脸表情识别,TP391.41
- 基于小波变换的信号稀疏表示及其在图像去噪中的应用,TP391.41
- 基于多视频矩阵控制协议的远程视频监控系统的设计与实现,TP277
- 基于LDPCA的分布式视频编码中的非均衡编码,TN919.81
- 基于压缩感知的语音稀疏基和投影矩阵构造技术的研究,TN919.8
- 基于压缩感知的信号恢复算法研究,TN911.7
- 基于Cortex-A8平台的H.264解码器优化,TN919.81
- 基于DCT域高压缩图像去块效应算法研究,TP391.41
- 基于自适应字典稀疏表示超分辨率重建的视频编码技术,TN919.81
- 基于超高清视频编码的同步分层运动估计架构的设计,TN919.81
- 可变光照和遮挡条件下的人脸识别技术研究及其应用,TP391.41
- 面向密集数据并行计算的可重构线性阵列处理器架构的设计,TP332
- 在线字典训练及加权差异性稀疏表示的研究,TP391.41
- 基于H.264编码标准的可逆视频信息隐藏技术的研究,TN919.81
- SUNIST球形托卡马克的MHD不稳定性研究,TL631.24
- 基于SVD的抗协议攻击的数字图像水印算法研究,TP309.7
- 多视点立体视频编解码算法的研究与应用,TN919.81
- 基于H.264的视频编码器的优化和解码器DPB管理的软硬件实现,TN762
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信 > 图像编码
© 2012 www.xueweilunwen.com
|