学位论文 > 优秀研究生学位论文题录展示
基于多核计算平台的视频压缩算法研究
作 者: 周晶
导 师: 曹雪虹
学 校: 南京邮电大学
专 业: 信号与信息处理
关键词: H.264/AVC 图形处理器 统一计算设备架构 并行计算
分类号: TN919.81
类 型: 硕士论文
年 份: 2012年
下 载: 24次
引 用: 0次
阅 读: 论文下载
内容摘要
本文首先研究了视频压缩编码标准H.264/AVC以及多核计算平台GPU的体系结构,在此研究基础上,针对视频压缩的核心算法,如预测编码(含帧内预测、帧间运动估计)、变换编码和熵编码等进行深入研究,分析各类算法的可并行性以及并行执行的最佳流程,设计并实现了基于CUDA平台的视频压缩并行算法(如预测编码并行算法、变换编码并行算法、CAVLC熵编码并行算法),并与传统的串行算法进行比较。实验结果表明,利用多核计算平台可以显著提高H.264/AVC的编码速度。对于计算密集度非常高的全搜索运动估计,加速比达到了160倍以上;而对于分支密集型的过程,如帧内预测、快速运动估计和CAVLC熵编码,加速比则分别只有9倍、3倍和3倍。这是由于GPU比较适合处理计算密集度高、逻辑分支简单的大规模数据并行计算,而分支判断等控制流语句则会大大影响GPU的执行性能。但是,通过大量线程实现的大规模数据并行足以弥补分支操作带来的影响,所以,对于分支密集型的过程多核计算平台依然可以获得良好的加速性能。
|
全文目录
摘要 4-5 Abstract 5-9 第一章 绪论 9-13 1.1 课题的研究背景与意义 9 1.2 国内外研究现状 9-11 1.2.1 H.264/AVC 的研究现状 9-10 1.2.2 基于GPU 的视频压缩研究 10-11 1.3 本文的研究内容 11 1.4 本文的章节安排 11-13 第二章 H.264/AVC 视频压缩编码 13-23 2.1 视频压缩基本概念 13-14 2.1.1 帧内预测编码 13 2.1.2 帧间预测编码 13 2.1.3 变换编码和量化 13-14 2.1.4 熵编码 14 2.2 H.264/AVC 编解码过程 14-15 2.2.1 H.264/AVC 的编码过程 14-15 2.2.2 H.264/AVC 的解码过程 15 2.3 H.264/AVC 的关键技术 15-22 2.3.1 帧内预测编码 16-17 2.3.2 帧间预测编码 17-18 2.3.3 整数变换和量化 18 2.3.4 熵编码 18-22 2.4 本章小结 22-23 第三章 多核计算平台GPU 和CUDA 体系架构 23-28 3.1 多核计算平台 23-24 3.1.1 多核计算 23 3.1.2 GPU 体系架构的发展 23-24 3.1.3 GPU 通用计算 24 3.2 CUDA 体系结构 24-27 3.2.1 CUDA 硬件架构 25 3.2.2 CUDA 编程模型 25-26 3.2.3 CUDA 存储器模型 26-27 3.3 本章小结 27-28 第四章 基于CUDA 的H.264/AVC 预测编码 28-45 4.1 基于CUDA 的帧内预测编码 28-32 4.1.1 帧内预测的并行计算模型 28-29 4.1.2 帧内预测的并行实现 29-30 4.1.3 帧内预测的指令优化 30-31 4.1.4 实验结果与分析 31-32 4.2 基于CUDA 的FS 运动估计 32-37 4.2.1 FS 运动估计的并行算法 32-33 4.2.2 FS 运动估计的并行实现 33-35 4.2.3 存储器性能优化 35-36 4.2.4 实验结果与分析 36-37 4.3 基于CUDA 的快速运动估计 37-44 4.3.1 快速运动估计 37-42 4.3.2 快速运动估计的并行算法 42 4.3.3 快速运动估计的并行实现 42-43 4.3.4 实验结果与分析 43-44 4.4 本章小结 44-45 第五章 基于CUDA 的H.264/AVC 变换编码 45-51 5.1 基于CUDA 的整数DCT 变换 45-49 5.1.1 整数DCT 变换 45-46 5.1.2 整数DCT 变换的并行实现 46-48 5.1.3 实验结果与分析 48-49 5.2 基于CUDA 的Hadamard 变换 49-50 5.2.1 Hadamard 变换 49 5.2.2 Hadamard 变换的并行实现 49-50 5.2.3 实验结果与分析 50 5.3 本章小结 50-51 第六章 基于 CUDA 的 H.264/AVC 熵编码 51-55 6.1 基于 CUDA 的 CAVLC 熵编码 51-54 6.1.1 CAVLC 的并行性分析 51-53 6.1.2 CAVLC 的并行实现 53 6.1.3 实验结果与分析 53-54 6.2 本章小结 54-55 第七章 总结与展望 55-57 7.1 总结 55 7.2 展望 55-57 致谢 57-58 参考文献 58-62 攻读硕士阶段发表的论文 62
|
相似论文
- 基于率失真优化的码率控制算法研究,TN919.81
- 一种高性能可扩展公钥密码协处理器的研究与设计,TN918.1
- H.264/AVC帧内预测模式选择算法研究,TN919.81
- 基于CUDA架构的H.264并行计算研究,TN919.81
- 基于H.264/AVC的自适应运动估计算法研究,TN919.81
- 基于GPU的有限元方法研究,O241.82
- 射频波注入磁化等离子体的数值模拟,TL612
- Web图像搜索中基于GPU的图像分割技术术究,TP391.41
- 新型电网广域后备保护的算法研究,TM774
- 保护在线自适应整定的研究,TM77
- 云环境下MapReduce容错技术的研究,TP302.8
- 流体场景的屏幕空间实时绘制研究,TP391.41
- 高动态SINS导航解算算法及其并行化研究,TN966
- 图像检索的并行计算方法与系统,TP391.3
- GPU加速的粒子滤波PET图像重建算法,TP391.41
- 基于GPU的时间序列并行检索算法研究,TP391.41
- 基于CPU的源强反算算法研究,TP18
- 基于GPU的H.264到AVS视频转码并行设计,TN919.81
- 基于运动矢量与漂移补偿的H.264视频水印算法研究,TP309.7
- 面向密集数据并行计算的可重构线性阵列处理器架构的设计,TP332
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信 > 图像编码
© 2012 www.xueweilunwen.com
|