学位论文 > 优秀研究生学位论文题录展示

基于多核计算平台的视频压缩算法研究

作 者: 周晶
导 师: 曹雪虹
学 校: 南京邮电大学
专 业: 信号与信息处理
关键词: H.264/AVC 图形处理器 统一计算设备架构 并行计算
分类号: TN919.81
类 型: 硕士论文
年 份: 2012年
下 载: 24次
引 用: 0次
阅 读: 论文下载
 

内容摘要


本文首先研究了视频压缩编码标准H.264/AVC以及多核计算平台GPU的体系结构,在此研究基础上,针对视频压缩的核心算法,如预测编码(含帧内预测、帧间运动估计)、变换编码和熵编码等进行深入研究,分析各类算法的可并行性以及并行执行的最佳流程,设计并实现了基于CUDA平台的视频压缩并行算法(如预测编码并行算法、变换编码并行算法、CAVLC熵编码并行算法),并与传统的串行算法进行比较。实验结果表明,利用多核计算平台可以显著提高H.264/AVC的编码速度。对于计算密集度非常高的全搜索运动估计,加速比达到了160倍以上;而对于分支密集型的过程,如帧内预测、快速运动估计和CAVLC熵编码,加速比则分别只有9倍、3倍和3倍。这是由于GPU比较适合处理计算密集度高、逻辑分支简单的大规模数据并行计算,而分支判断等控制流语句则会大大影响GPU的执行性能。但是,通过大量线程实现的大规模数据并行足以弥补分支操作带来的影响,所以,对于分支密集型的过程多核计算平台依然可以获得良好的加速性能。

全文目录


摘要  4-5
Abstract  5-9
第一章 绪论  9-13
  1.1 课题的研究背景与意义  9
  1.2 国内外研究现状  9-11
    1.2.1 H.264/AVC 的研究现状  9-10
    1.2.2 基于GPU 的视频压缩研究  10-11
  1.3 本文的研究内容  11
  1.4 本文的章节安排  11-13
第二章 H.264/AVC 视频压缩编码  13-23
  2.1 视频压缩基本概念  13-14
    2.1.1 帧内预测编码  13
    2.1.2 帧间预测编码  13
    2.1.3 变换编码和量化  13-14
    2.1.4 熵编码  14
  2.2 H.264/AVC 编解码过程  14-15
    2.2.1 H.264/AVC 的编码过程  14-15
    2.2.2 H.264/AVC 的解码过程  15
  2.3 H.264/AVC 的关键技术  15-22
    2.3.1 帧内预测编码  16-17
    2.3.2 帧间预测编码  17-18
    2.3.3 整数变换和量化  18
    2.3.4 熵编码  18-22
  2.4 本章小结  22-23
第三章 多核计算平台GPU 和CUDA 体系架构  23-28
  3.1 多核计算平台  23-24
    3.1.1 多核计算  23
    3.1.2 GPU 体系架构的发展  23-24
    3.1.3 GPU 通用计算  24
  3.2 CUDA 体系结构  24-27
    3.2.1 CUDA 硬件架构  25
    3.2.2 CUDA 编程模型  25-26
    3.2.3 CUDA 存储器模型  26-27
  3.3 本章小结  27-28
第四章 基于CUDA 的H.264/AVC 预测编码  28-45
  4.1 基于CUDA 的帧内预测编码  28-32
    4.1.1 帧内预测的并行计算模型  28-29
    4.1.2 帧内预测的并行实现  29-30
    4.1.3 帧内预测的指令优化  30-31
    4.1.4 实验结果与分析  31-32
  4.2 基于CUDA 的FS 运动估计  32-37
    4.2.1 FS 运动估计的并行算法  32-33
    4.2.2 FS 运动估计的并行实现  33-35
    4.2.3 存储器性能优化  35-36
    4.2.4 实验结果与分析  36-37
  4.3 基于CUDA 的快速运动估计  37-44
    4.3.1 快速运动估计  37-42
    4.3.2 快速运动估计的并行算法  42
    4.3.3 快速运动估计的并行实现  42-43
    4.3.4 实验结果与分析  43-44
  4.4 本章小结  44-45
第五章 基于CUDA 的H.264/AVC 变换编码  45-51
  5.1 基于CUDA 的整数DCT 变换  45-49
    5.1.1 整数DCT 变换  45-46
    5.1.2 整数DCT 变换的并行实现  46-48
    5.1.3 实验结果与分析  48-49
  5.2 基于CUDA 的Hadamard 变换  49-50
    5.2.1 Hadamard 变换  49
    5.2.2 Hadamard 变换的并行实现  49-50
    5.2.3 实验结果与分析  50
  5.3 本章小结  50-51
第六章 基于 CUDA 的 H.264/AVC 熵编码  51-55
  6.1 基于 CUDA 的 CAVLC 熵编码  51-54
    6.1.1 CAVLC 的并行性分析  51-53
    6.1.2 CAVLC 的并行实现  53
    6.1.3 实验结果与分析  53-54
  6.2 本章小结  54-55
第七章 总结与展望  55-57
  7.1 总结  55
  7.2 展望  55-57
致谢  57-58
参考文献  58-62
攻读硕士阶段发表的论文  62

相似论文

  1. 基于率失真优化的码率控制算法研究,TN919.81
  2. 一种高性能可扩展公钥密码协处理器的研究与设计,TN918.1
  3. H.264/AVC帧内预测模式选择算法研究,TN919.81
  4. 基于CUDA架构的H.264并行计算研究,TN919.81
  5. 基于H.264/AVC的自适应运动估计算法研究,TN919.81
  6. 基于GPU的有限元方法研究,O241.82
  7. 射频波注入磁化等离子体的数值模拟,TL612
  8. Web图像搜索中基于GPU的图像分割技术术究,TP391.41
  9. 新型电网广域后备保护的算法研究,TM774
  10. 保护在线自适应整定的研究,TM77
  11. 云环境下MapReduce容错技术的研究,TP302.8
  12. 流体场景的屏幕空间实时绘制研究,TP391.41
  13. 高动态SINS导航解算算法及其并行化研究,TN966
  14. 图像检索的并行计算方法与系统,TP391.3
  15. GPU加速的粒子滤波PET图像重建算法,TP391.41
  16. 基于GPU的时间序列并行检索算法研究,TP391.41
  17. 基于CPU的源强反算算法研究,TP18
  18. 基于GPU的H.264到AVS视频转码并行设计,TN919.81
  19. 基于运动矢量与漂移补偿的H.264视频水印算法研究,TP309.7
  20. 面向密集数据并行计算的可重构线性阵列处理器架构的设计,TP332

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信 > 图像编码
© 2012 www.xueweilunwen.com