学位论文 > 优秀研究生学位论文题录展示
基于卡方检测和宏块类型统计的视频镜头边界检测算法的研究
作 者: 陈曦
导 师: 蒋兴浩;孙锬锋
学 校: 上海交通大学
专 业: 通信与信息系统
关键词: 镜头边界检测 DC直方图 卡方检测 机器学习 宏块类型统计
分类号: TP391.41
类 型: 硕士论文
年 份: 2009年
下 载: 25次
引 用: 1次
阅 读: 论文下载
内容摘要
随着网络视频在近几年的时间内迅速发展,对海量的视频信息进行检索与分类,成为了目前视频分析处理领域研究的热点问题。为了检索视频,提取出视频中的相关信息,需要将视频分解成多个基本单元镜头的集合,最终提取出关键帧和运动信息。因此视频的镜头分割,即镜头边界检测是镜头分析中最基本最重要的内容之一,也是必不可少的前期准备工作。本文借鉴了前人在这方面工作的成果,提出了基于视频I-帧亮度DC分量直方图卡方(χ2)检测及宏块类型统计特性分析的镜头边界检测算法。本算法首先获取压缩视频所有图像组GOP(Group of Pictures)中I-帧帧间亮度DC分量的直方图卡方值,该卡方值表示了相邻I-帧间的帧间差,帧间差异越大,表明相邻I-帧间的GOP内越有可能存在镜头边界,因此需要一个阈值设定算法来判定相邻I-帧间是否具有镜头变换。通过本文提出的基于机器学习思想的阈值动态设定算法可以在GOP级别初步判断镜头变换的位置。由于对于类型、格式和画面质量等参数不相同的视频段,帧间差卡方值的阈值不尽相同,因此通过大量实验数据动态训练阈值,找出实验数据中与实际情况最相近、准确率和查全率均最高的阈值作为最佳阈值。之后,计算可能存在镜头变换的GOP中每一帧与前一帧的相似度与相似度差,通过设定合适的阈值从而判断是否存在镜头变换,镜头变换是切变还是渐变,最终完成MPEG-2视频镜头边界检测目的。仿真实验结果表明:本文算法无论是切变还是渐变都具有较高的准确率,并且由于本文算法不对MPEG-2视频进行解压缩处理,而是通过GOP直接计算得到,因此镜头分割效率高,耗时少,计算量大大降低。
|
全文目录
摘要 3-5 ABSTRACT 5-9 第一章 绪论 9-23 1.1 研究背景 9-10 1.2 研究现状 10-21 1.2.1 视频镜头分割技术简介 10 1.2.2 视频镜头分割技术分类 10-12 1.2.3 视频镜头分割技术算法 12-21 1.3 论文主要创新特点 21-22 1.4 论文结构 22-23 第二章 基础知识介绍 23-42 2.1 卡方检测原理 23-25 2.1.1 卡方检验基本思想 23-24 2.1.2 卡方模型 24 2.1.3 卡方应用领域 24-25 2.1.4 卡方公式在本为中的推理 25 2.2 MPEG 视频编码标准 25-32 2.2.1 MPEG 简介 25-26 2.2.2 MPEG 图像压缩原理 26-27 2.2.3 MPEG 视频分层结构 27-30 2.2.4 MPEG 运动补偿预测 30-31 2.2.5 MPEG-2 视频帧结构 31-32 2.2.6 播放顺序与编码顺序 32 2.3 机器学习(Machine Learning)理论 32-41 2.3.1 机器学习原理 32-33 2.3.2 机器学习的主要策略 33-34 2.3.3 机器学习系统的基本结构 34-35 2.3.4 机器学习分类 35-39 2.3.5 目前研究领域 39-40 2.3.6 机器学习的思想在阈值动态设定算法中的应用 40-41 2.4 本章小结 41-42 第三章 卡方检测算法、阈值动态设定算法和宏块类型统计特性分析方法研究 42-52 3.1 I-帧亮度DC 分量直方图卡方检测算法研究 42-46 3.1.1 DCT 变换与DC 分量 42-43 3.1.2 I-帧的DC 分量 43 3.1.3 I-帧DC 分量直方图卡方检测原理 43-44 3.1.4 I-帧DC 分量直方图卡方检测算法步骤 44-46 3.2 基于机器学习思想的阈值动态设定算法研究 46-48 3.2.1 Dk阈值动态设定算法思想 46-48 3.2.2 Dk阈值动态设定算法步骤 48 3.3 宏块类型统计特性分析研究 48-51 3.3.1 宏块类型信息提取 49-50 3.3.2 相似度与相似度差 50 3.3.3 宏块类型统计特性分析步骤 50-51 3.4 本章小结 51-52 第四章 基于卡方检测和宏块类型统计的视频镜头边界检测算法研究 52-58 4.1 算法基本思想 52-53 4.2 算法数学模型 53-55 4.3 算法整体框架 55-56 4.4 算法总体步骤 56-57 4.5 本章小结 57-58 第五章 算法仿真实验与分析 58-70 5.1 实验条件 58 5.2 算法可行性实验 58-64 5.2.1 I-帧亮度DC 分量直方图卡方检测与Dk阈值设定 58-61 5.2.2 相似度T(k)和相似度差Et(k)检测 61-63 5.2.3 不同类型视频的镜头分割分析 63-64 5.3 算法对比性实验 64-66 5.4 算法误判/漏判实验分析 66-68 5.4.1 新闻类视频误判/漏判分析 66-67 5.4.2 电影类视频误判/漏判分析 67-68 5.4.3 体育类视频误判/漏判分析 68 5.5 本章小结 68-70 第六章 结束语 70-72 6.1 本文创新工作 70 6.2 未来展望 70-72 参考文献 72-76 致谢 76-77 攻读硕士期间已发表和已录用的论文 77-78 在研期间参加项目情况 78-80
|
相似论文
- 基于数据分布特征的文本分类研究,TP391.1
- 基于条件随机场的中文分词技术的研究与实现,TP391.1
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- Android恶意软件静态检测方案的研究,TP309
- 监督主题模型的研究与应用,TP391.1
- 基于失真效应的图像质量评价与分类,TP391.41
- 基于学习的逆向运动学人体运动合成,TP391.41
- 基于内容的网页恶意代码检测的研究与实现,TP393.092
- 学术主页信息抽取系统的研究,TP393.092
- 社会化网络中的推荐算法及其应用,TP391.3
- 数据挖掘在邮件反垃圾系统中的应用,TP393.098
- 基于自学习的社会关系抽取的研究,TP391.1
- 基于统计与图模型的若干机器学习算法及其应用,TP181
- P2P流量识别方法研究,TP393.06
- 基于粗糙集和SVM的国防生综合素质测评方法研究,E075
- 基于SIFT特征和SVM的场景分类,TP391.41
- 基于稀疏编码与机器学习的图像内容识别算法研究,TP391.41
- 随机森林特征选择,TP311.13
- 互联网流量应用基准分类技术的研究,TP393.06
- 基于丰富特征和多核学习的蛋白质关系抽取,Q51
- 弥散张量成像的脑连接模式分析,R445.2
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|