学位论文 > 优秀研究生学位论文题录展示
基于压缩域的视频关键帧提取算法研究
作 者: 晋云功
导 师: 卢燕飞
学 校: 北京交通大学
专 业: 通信与信息系统
关键词: 基于内容的视频检索 模糊推理 运动补偿 MPEG压缩域 关键帧
分类号: TP391.41
类 型: 硕士论文
年 份: 2009年
下 载: 182次
引 用: 1次
阅 读: 论文下载
内容摘要
随着计算机技术、多媒体技术以及Internet的迅速发展和广泛应用,多媒体数据的应用越来越多,其中最复杂的是视频信息。视频信息的快速增长,使得人们对其进行快速有效的管理和检索越来越困难。因此,如何才能有效且快速地对这些视频信息进行检索和管理,成为目前急待解决的一个难题。本论文重点研究视频检索系统中的关键帧提取技术。论文主要研究了一种基于压缩域的视频关键帧提取算法,算法通过直接提取压缩后的视频编码数据,并对这些数据进行分析,然后引用模糊判决理论实现视频关键帧提取。同时根据算法原理,论文设计并编程实现了一个关键帧提取应用系统。论文的主要内容如下:首先,论文阐明了本课题的研究背景和意义,并介绍了视频检索在国内外的发展历史和现状。在此基础上论文认真地研究了视频压缩的基本理论及MPEG视频压缩标准,并对视频流的层次结构进行了详细的分析。重点研究了MPEG视频流中宏块层所蕴含的帧间差信息。其次,论文对基于内容的视频检索系统中的关键技术进行了研究,其中包括:镜头检测、关键帧提取、场景提取、视频索引和浏览。重点研究了关键帧提取技术,并在“比较宏块互异数算法”的基础上,进行了算法改进和创新,提出了一种基于宏块运动预测和补偿从MPEG视频流中提取关键帧的算法。然后,论文对前面提出的算法进行了编程实现,完成了一个基于内容的视频关键帧提取系统,实验结果证明系统的输出结果符合算法的预期效果。最后,对全文的工作进行了总结,提出了自己对视频检索领域发展的一点认识,并为今后的工作指明了努力方向。
|
全文目录
致谢 5-6 中文摘要 6-7 ABSTRACT 7-14 1 绪论 14-20 1.1 研究问题的提出 14 1.2 国内外的研究现状 14-18 1.2.1 国外的视频检索发展现状 15-17 1.2.2 国内的视频检索研究现状 17-18 1.3 论文所做的工作 18-19 1.4 论文结构安排 19-20 2 基于内容的视频检索关键技术 20-39 2.1 MPEG标准和视频流结构 20-27 2.1.1 MPEG标准簇 20-21 2.1.2 视频流结构 21-24 2.1.3 MPEG压缩原理 24-26 2.1.4 MPEG视频流所蕴含的信息 26-27 2.2 镜头检测 27-31 2.2.1 镜头变换的基本概念 27-29 2.2.2 镜头检测算法 29-31 2.3 关键帧提取 31-35 2.3.1 非压缩域关键帧提取算法 31-34 2.3.2 压缩域视频关键帧提取算法 34-35 2.4 镜头聚类和场景提取 35-36 2.5 视频索引与浏览 36-38 2.5.1 视频索引 36-37 2.5.2 视频浏览 37-38 2.6 本章小结 38-39 3 基于压缩域的视频关键帧提取算法研究 39-48 3.1 算法原理 39 3.2 算法参数确定 39-42 3.2.1 帧匹配度S_p和帧匹配度差E_p 40-41 3.2.2 宏块运动强度差E_M 41 3.2.3 I帧集中度D_I 41-42 3.3 模糊判决方法 42-47 3.3.1 模糊判决理论 42-46 3.3.2 算法模糊判决 46-47 3.4 本章小结 47-48 4 基于压缩域的视频关键帧提取系统实现 48-71 4.1 系统的总体设计 48-52 4.1.1 系统的设计目标 48 4.1.2 系统的总体架构 48-51 4.1.3 系统的处理流程 51-52 4.2 主要数据结构和核心类 52-62 4.2.1 主要数据结构 52-54 4.2.2 核心类 54-56 4.2.3 其他关键技术和算法 56-62 4.3 系统具体实现 62-69 4.3.1 编程开发环境 62 4.3.2 系统主控制台 62-64 4.3.3 算法参数提取和分析 64-66 4.3.4 算法计算 66-68 4.3.5 算法结果输出和评价 68-69 4.4 系统的性能测试 69-70 4.4.1 系统测试 69-70 4.5 本章小结 70-71 5 总结与展望 71-73 5.1 本文工作总结 71 5.2 进一步的展望 71-73 参考文献 73-75 作者简历 75-77 学位论文数据集 77
|
相似论文
- 虚拟人运动仿真研究,R318.0
- 基于加权投票和关键帧提取的视频流人脸识别方法研究,TP391.41
- 模糊预测函数控制改进算法的研究及应用,TP273
- 分布式视频编码中边信息技术研究,TN919.81
- 基于FFmpeg的H.264解码器在Symbian上的移植和优化,TN919.81
- 基于关键帧混合建模的视频对象分割技术研究,TP391.41
- 永磁同步电机矢量控制系统研究,TM341
- 基于场景的非均匀性校正,TN215
- 视频分析中的镜头分割和目标跟踪研究,TP391.41
- 基于小波变换的心电波形分类及冠心病自动诊断,TN911.7
- 基于中介逻辑的模糊信息处理的研究,O159
- 太阳能空气采暖系统变流量运行策略优化方法研究,TU832
- 基于权重颜色分量和粒子群算法的视频检索方法的研究,TP391.41
- 基于压缩域特征的视频检索技术研究,TP391.41
- 视频镜头边界检测算法的研究,TP391.41
- H.264帧间编码算法的研究与VLSI实现,TN919.81
- 高性能视频检索平台中网络性能优化设计与实现,TP393.09
- 基于CLIPS内核的嵌入式专家系统工具研究与应用,TP182
- 基于模糊推理和神经网络的预想事故自动选择研究,TM711
- 时空融合的视觉选择注意模型及其在MPEG压缩域应用研究,TP391.41
- 基于投影的数字视频稳像技术研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|