学位论文 > 优秀研究生学位论文题录展示

面向网络应用的实时视频编码算法优化

作 者: 朱洪波
导 师: 张松
学 校: 中国科学院研究生院(计算技术研究所)
专 业: 计算机应用
关键词: Scaled 整数近似 DCT 编码模式 预先排除 率失真优化 码率控制 置信概率
分类号: TN919.81
类 型: 硕士论文
年 份: 2004年
下 载: 64次
引 用: 1次
阅 读: 论文下载
 

内容摘要


视频编码技术是当今方兴未艾的各种视频应用的核心技术。目前广泛使用的视频编码技术是基于块的混合视频编码技术,本文针对它在实时交互式网络应用情况下的算法优化进行了深入的研究。本文的研究工作包括三个部分,分别是快速scaled整数无乘近似DCT算法、是否需要四运动向量估计的预先判断算法以及快速单通率失真优化码率控制算法。本文首先提出了一个快速的scaled整数无乘近似的离散余弦变换(DCT)算法。通过充分利用Scaled DCT中的Scaled因子在一定程度上是任意的这个特性,本文提出采用优化程序来选择scaled因子使Scaled DCT计算最小化的方法。本文提出的一维8点DCT算法相比以往的实现在复杂度上有非常大的减少。在绝大多数情况下,在保持和浮点DCT相同性能的条件下,一维8点整数无乘近似DCT算法仅需要36次加减法或移位运算。本文第二部分工作是四运动向量运动估计的预先排除算法。在使用率失真优化方法的MPEG-4视频编码框架中,当已知16x16运动向量时,通过对16x16运动向量所导致的宏块各部分绝对差之和(SAD)和运动向量做简单的计算,排除相当一部分宏块不需要4次8x8运动估计,而PSNR性能的损失则可以忽略不计。实验结果表明,算法对高、中和低运动序列都有非常好的判决性能,对高运动序列Stefan CIF,有50%以上的宏块被排除,中低运动序列Foreman CIF和Akiyo CIF,有75%以上的宏块被排除,而PSNR仅平均下降约0.02dB。判决算法的复杂度相对于运动估计的复杂度而言,仅仅是边界的。论文的最后一部分工作是面向网络实时应用的快速单通率失真优化码率控制算法。为了快速适应于场景的改变,本文首先把P帧中部分宏块所需要的比特数和所有宏块所需要的比特数之比看作一个随机变量,从而可以由经验数据估计出它的分布。这样就可以在部分宏块已做运动估计的情况下,先根据SAD估计出这些宏块所需要的比特数,然后以一定的置

全文目录


摘要  4-6
Abstract(英文摘要)  6-10
第一章 引言  10-16
  1.1 研究背景  10-11
  1.2 交互式视频应用对视频编码的要求  11-14
    1.2.1 交互式视频应用的模型  11-12
    1.2.2 延迟对视频编码的要求  12-14
    1.2.3 带宽对视频编码的要求  14
    1.2.4 损失对视频编码的要求  14
  1.3 论文各部分的主要内容  14-16
第二章 快速离散余弦变换算法  16-31
  2.1 快速离散余弦变换研究现状  16-21
    2.1.1 简介  16-18
    2.1.2 整数无乘近似DCT算法  18-21
  2.2 一种新的整数无乘近似Scaled DCT算法  21-31
    2.2.1 用优化程序来设计Scaled DCT算法  21-25
    2.2.2 优化程序选择结果  25-27
    2.2.3 实验结果  27-30
    2.2.4 结论  30-31
第三章 运动估计与编码模式判决  31-46
  3.1 运动估计与编码模式判决的研究现状  31-37
    3.1.1 运动估计研究现状  31-32
    3.1.2 编码模式判决研究现状  32-37
  3.2 MPEG-4中四运动向量运动估计的预先排除算法(4MVPE)  37-46
    3.2.1 宏块帧差信息与运动向量分析  37-39
    3.2.2 4MVPE算法  39-41
    3.2.3 实验结果  41-44
    3.2.4 结论  44-46
第四章 快速码率控制算法  46-61
  4.1 码率控制研究现状  46-49
  4.2 缓冲区限制的单通率失真优化快速码率控制算法  49-61
    4.2.1 运动估计过程中P帧比特数的估计  49-53
    4.2.2 一个新的P帧Rate-Quantization关系  53-54
    4.2.3 算法描述  54-57
    4.2.4 实验结果  57-60
    4.2.5 结论  60-61
结论  61-63
参考文献  63-69
致谢  69-70
作者简历  70

相似论文

  1. 基于率失真优化的码率控制算法研究,TN919.81
  2. 彩色图像水印的非线性检测方案研究,TP309.7
  3. 基于LDPCA的分布式视频编码中的非均衡编码,TN919.81
  4. 基于H.264/AVC可分级视频编码算法的研究,TN919.81
  5. 高效三维视频表达及编码技术研究与开发,TN919.81
  6. 新型大容量信息隐写算法研究,TN918
  7. 面向窄带通信的视频编码技术研究,TN919.81
  8. 视频编码技术在网络教学中的应用研究,TN919.81
  9. 基于MPEG-4的运动目标检测技术研究,TP391.41
  10. 基于H.264/AVC压缩域的视频运动目标检测,TP391.41
  11. 基于H.264加权预测MAD的码率控制算法的改进与移植,TN919.81
  12. 方向DCT及其在H.264视频编码中的应用研究,TN919.81
  13. H.264视频编码器帧内预测硬件结构设计,TN919.81
  14. 基于灰色理论的DCT域信息隐藏技术研究,TP393.08
  15. 基于混合域及分形理论的抗几何攻击数字水印算法研究,TP309.7
  16. 基于DCT的自适应彩色图像水印算法研究,TP309.7
  17. 人脸识别算法在双核DSP上的实现与优化,TP391.41
  18. 基于DCT域的图像数字水印技术研究,TP309.7
  19. 形状自适应变换及其在感兴趣区域编码中的应用研究,TP391.41
  20. 图像数字水印与性能评估技术研究,TP309.7
  21. 面向立体视频的质量评价与码率控制技术研究,TP391.41

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信 > 图像编码
© 2012 www.xueweilunwen.com