学位论文 > 优秀研究生学位论文题录展示

基于多核计算平台的视频压缩算法研究

作　者: 周晶
导　师: 曹雪虹
学　校: 南京邮电大学
专　业: 信号与信息处理
关键词: H.264/AVC 图形处理器统一计算设备架构并行计算
分类号: TN919.81
类　型: 硕士论文
年　份: 2012年
下　载: 24次
引　用: 0次
阅　读: 论文下载

内容摘要

本文首先研究了视频压缩编码标准H.264/AVC以及多核计算平台GPU的体系结构,在此研究基础上,针对视频压缩的核心算法,如预测编码(含帧内预测、帧间运动估计)、变换编码和熵编码等进行深入研究,分析各类算法的可并行性以及并行执行的最佳流程,设计并实现了基于CUDA平台的视频压缩并行算法(如预测编码并行算法、变换编码并行算法、CAVLC熵编码并行算法),并与传统的串行算法进行比较。实验结果表明,利用多核计算平台可以显著提高H.264/AVC的编码速度。对于计算密集度非常高的全搜索运动估计,加速比达到了160倍以上;而对于分支密集型的过程,如帧内预测、快速运动估计和CAVLC熵编码,加速比则分别只有9倍、3倍和3倍。这是由于GPU比较适合处理计算密集度高、逻辑分支简单的大规模数据并行计算,而分支判断等控制流语句则会大大影响GPU的执行性能。但是,通过大量线程实现的大规模数据并行足以弥补分支操作带来的影响,所以,对于分支密集型的过程多核计算平台依然可以获得良好的加速性能。

全文目录

摘要  4-5
Abstract  5-9
第一章绪论  9-13
  1.1 课题的研究背景与意义  9
  1.2 国内外研究现状  9-11
    1.2.1 H.264/AVC 的研究现状  9-10
    1.2.2 基于GPU 的视频压缩研究  10-11
  1.3 本文的研究内容  11
  1.4 本文的章节安排  11-13
第二章 H.264/AVC 视频压缩编码  13-23
  2.1 视频压缩基本概念  13-14
    2.1.1 帧内预测编码  13
    2.1.2 帧间预测编码  13
    2.1.3 变换编码和量化  13-14
    2.1.4 熵编码  14
  2.2 H.264/AVC 编解码过程  14-15
    2.2.1 H.264/AVC 的编码过程  14-15
    2.2.2 H.264/AVC 的解码过程  15
  2.3 H.264/AVC 的关键技术  15-22
    2.3.1 帧内预测编码  16-17
    2.3.2 帧间预测编码  17-18
    2.3.3 整数变换和量化  18
    2.3.4 熵编码  18-22
  2.4 本章小结  22-23
第三章多核计算平台GPU 和CUDA 体系架构  23-28
  3.1 多核计算平台  23-24
    3.1.1 多核计算  23
    3.1.2 GPU 体系架构的发展  23-24
    3.1.3 GPU 通用计算  24
  3.2 CUDA 体系结构  24-27
    3.2.1 CUDA 硬件架构  25
    3.2.2 CUDA 编程模型  25-26
    3.2.3 CUDA 存储器模型  26-27
  3.3 本章小结  27-28
第四章基于CUDA 的H.264/AVC 预测编码  28-45
  4.1 基于CUDA 的帧内预测编码  28-32
    4.1.1 帧内预测的并行计算模型  28-29
    4.1.2 帧内预测的并行实现  29-30
    4.1.3 帧内预测的指令优化  30-31
    4.1.4 实验结果与分析  31-32
  4.2 基于CUDA 的FS 运动估计  32-37
    4.2.1 FS 运动估计的并行算法  32-33
    4.2.2 FS 运动估计的并行实现  33-35
    4.2.3 存储器性能优化  35-36
    4.2.4 实验结果与分析  36-37
  4.3 基于CUDA 的快速运动估计  37-44
    4.3.1 快速运动估计  37-42
    4.3.2 快速运动估计的并行算法  42
    4.3.3 快速运动估计的并行实现  42-43
    4.3.4 实验结果与分析  43-44
  4.4 本章小结  44-45
第五章基于CUDA 的H.264/AVC 变换编码  45-51
  5.1 基于CUDA 的整数DCT 变换  45-49
    5.1.1 整数DCT 变换  45-46
    5.1.2 整数DCT 变换的并行实现  46-48
    5.1.3 实验结果与分析  48-49
  5.2 基于CUDA 的Hadamard 变换  49-50
    5.2.1 Hadamard 变换  49
    5.2.2 Hadamard 变换的并行实现  49-50
    5.2.3 实验结果与分析  50
  5.3 本章小结  50-51
第六章基于 CUDA 的 H.264/AVC 熵编码  51-55
  6.1 基于 CUDA 的 CAVLC 熵编码  51-54
    6.1.1 CAVLC 的并行性分析  51-53
    6.1.2 CAVLC 的并行实现  53
    6.1.3 实验结果与分析  53-54
  6.2 本章小结  54-55
第七章总结与展望  55-57
  7.1 总结  55
  7.2 展望  55-57
致谢  57-58
参考文献  58-62
攻读硕士阶段发表的论文  62

基于多核计算平台的视频压缩算法研究

内容摘要

全文目录

相似论文