学位论文 > 优秀研究生学位论文题录展示

基于压缩域的视频关键帧提取算法研究

作 者: 晋云功
导 师: 卢燕飞
学 校: 北京交通大学
专 业: 通信与信息系统
关键词: 基于内容的视频检索 模糊推理 运动补偿 MPEG压缩域 关键帧
分类号: TP391.41
类 型: 硕士论文
年 份: 2009年
下 载: 182次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着计算机技术、多媒体技术以及Internet的迅速发展和广泛应用,多媒体数据的应用越来越多,其中最复杂的是视频信息。视频信息的快速增长,使得人们对其进行快速有效的管理和检索越来越困难。因此,如何才能有效且快速地对这些视频信息进行检索和管理,成为目前急待解决的一个难题。本论文重点研究视频检索系统中的关键帧提取技术。论文主要研究了一种基于压缩域的视频关键帧提取算法,算法通过直接提取压缩后的视频编码数据,并对这些数据进行分析,然后引用模糊判决理论实现视频关键帧提取。同时根据算法原理,论文设计并编程实现了一个关键帧提取应用系统。论文的主要内容如下:首先,论文阐明了本课题的研究背景和意义,并介绍了视频检索在国内外的发展历史和现状。在此基础上论文认真地研究了视频压缩的基本理论及MPEG视频压缩标准,并对视频流的层次结构进行了详细的分析。重点研究了MPEG视频流中宏块层所蕴含的帧间差信息。其次,论文对基于内容的视频检索系统中的关键技术进行了研究,其中包括:镜头检测、关键帧提取、场景提取、视频索引和浏览。重点研究了关键帧提取技术,并在“比较宏块互异数算法”的基础上,进行了算法改进和创新,提出了一种基于宏块运动预测和补偿从MPEG视频流中提取关键帧的算法。然后,论文对前面提出的算法进行了编程实现,完成了一个基于内容的视频关键帧提取系统,实验结果证明系统的输出结果符合算法的预期效果。最后,对全文的工作进行了总结,提出了自己对视频检索领域发展的一点认识,并为今后的工作指明了努力方向。

全文目录


致谢  5-6
中文摘要  6-7
ABSTRACT  7-14
1 绪论  14-20
  1.1 研究问题的提出  14
  1.2 国内外的研究现状  14-18
    1.2.1 国外的视频检索发展现状  15-17
    1.2.2 国内的视频检索研究现状  17-18
  1.3 论文所做的工作  18-19
  1.4 论文结构安排  19-20
2 基于内容的视频检索关键技术  20-39
  2.1 MPEG标准和视频流结构  20-27
    2.1.1 MPEG标准簇  20-21
    2.1.2 视频流结构  21-24
    2.1.3 MPEG压缩原理  24-26
    2.1.4 MPEG视频流所蕴含的信息  26-27
  2.2 镜头检测  27-31
    2.2.1 镜头变换的基本概念  27-29
    2.2.2 镜头检测算法  29-31
  2.3 关键帧提取  31-35
    2.3.1 非压缩域关键帧提取算法  31-34
    2.3.2 压缩域视频关键帧提取算法  34-35
  2.4 镜头聚类和场景提取  35-36
  2.5 视频索引与浏览  36-38
    2.5.1 视频索引  36-37
    2.5.2 视频浏览  37-38
  2.6 本章小结  38-39
3 基于压缩域的视频关键帧提取算法研究  39-48
  3.1 算法原理  39
  3.2 算法参数确定  39-42
    3.2.1 帧匹配度S_p和帧匹配度差E_p  40-41
    3.2.2 宏块运动强度差E_M  41
    3.2.3 I帧集中度D_I  41-42
  3.3 模糊判决方法  42-47
    3.3.1 模糊判决理论  42-46
    3.3.2 算法模糊判决  46-47
  3.4 本章小结  47-48
4 基于压缩域的视频关键帧提取系统实现  48-71
  4.1 系统的总体设计  48-52
    4.1.1 系统的设计目标  48
    4.1.2 系统的总体架构  48-51
    4.1.3 系统的处理流程  51-52
  4.2 主要数据结构和核心类  52-62
    4.2.1 主要数据结构  52-54
    4.2.2 核心类  54-56
    4.2.3 其他关键技术和算法  56-62
  4.3 系统具体实现  62-69
    4.3.1 编程开发环境  62
    4.3.2 系统主控制台  62-64
    4.3.3 算法参数提取和分析  64-66
    4.3.4 算法计算  66-68
    4.3.5 算法结果输出和评价  68-69
  4.4 系统的性能测试  69-70
    4.4.1 系统测试  69-70
  4.5 本章小结  70-71
5 总结与展望  71-73
  5.1 本文工作总结  71
  5.2 进一步的展望  71-73
参考文献  73-75
作者简历  75-77
学位论文数据集  77

相似论文

  1. 虚拟人运动仿真研究,R318.0
  2. 基于加权投票和关键帧提取的视频流人脸识别方法研究,TP391.41
  3. 模糊预测函数控制改进算法的研究及应用,TP273
  4. 分布式视频编码中边信息技术研究,TN919.81
  5. 基于FFmpeg的H.264解码器在Symbian上的移植和优化,TN919.81
  6. 基于关键帧混合建模的视频对象分割技术研究,TP391.41
  7. 永磁同步电机矢量控制系统研究,TM341
  8. 基于场景的非均匀性校正,TN215
  9. 视频分析中的镜头分割和目标跟踪研究,TP391.41
  10. 基于小波变换的心电波形分类及冠心病自动诊断,TN911.7
  11. 基于中介逻辑的模糊信息处理的研究,O159
  12. 太阳能空气采暖系统变流量运行策略优化方法研究,TU832
  13. 基于权重颜色分量和粒子群算法的视频检索方法的研究,TP391.41
  14. 基于压缩域特征的视频检索技术研究,TP391.41
  15. 视频镜头边界检测算法的研究,TP391.41
  16. H.264帧间编码算法的研究与VLSI实现,TN919.81
  17. 高性能视频检索平台中网络性能优化设计与实现,TP393.09
  18. 基于CLIPS内核的嵌入式专家系统工具研究与应用,TP182
  19. 基于模糊推理和神经网络的预想事故自动选择研究,TM711
  20. 时空融合的视觉选择注意模型及其在MPEG压缩域应用研究,TP391.41
  21. 基于投影的数字视频稳像技术研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com