学位论文 > 优秀研究生学位论文题录展示

基于卡方检测和宏块类型统计的视频镜头边界检测算法的研究

作 者: 陈曦
导 师: 蒋兴浩;孙锬锋
学 校: 上海交通大学
专 业: 通信与信息系统
关键词: 镜头边界检测 DC直方图 卡方检测 机器学习 宏块类型统计
分类号: TP391.41
类 型: 硕士论文
年 份: 2009年
下 载: 25次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着网络视频在近几年的时间内迅速发展,对海量的视频信息进行检索与分类,成为了目前视频分析处理领域研究的热点问题。为了检索视频,提取出视频中的相关信息,需要将视频分解成多个基本单元镜头的集合,最终提取出关键帧和运动信息。因此视频的镜头分割,即镜头边界检测是镜头分析中最基本最重要的内容之一,也是必不可少的前期准备工作。本文借鉴了前人在这方面工作的成果,提出了基于视频I-帧亮度DC分量直方图卡方(χ2)检测及宏块类型统计特性分析的镜头边界检测算法。本算法首先获取压缩视频所有图像组GOP(Group of Pictures)中I-帧帧间亮度DC分量的直方图卡方值,该卡方值表示了相邻I-帧间的帧间差,帧间差异越大,表明相邻I-帧间的GOP内越有可能存在镜头边界,因此需要一个阈值设定算法来判定相邻I-帧间是否具有镜头变换。通过本文提出的基于机器学习思想的阈值动态设定算法可以在GOP级别初步判断镜头变换的位置。由于对于类型、格式和画面质量等参数不相同的视频段,帧间差卡方值的阈值不尽相同,因此通过大量实验数据动态训练阈值,找出实验数据中与实际情况最相近、准确率和查全率均最高的阈值作为最佳阈值。之后,计算可能存在镜头变换的GOP中每一帧与前一帧的相似度与相似度差,通过设定合适的阈值从而判断是否存在镜头变换,镜头变换是切变还是渐变,最终完成MPEG-2视频镜头边界检测目的。仿真实验结果表明:本文算法无论是切变还是渐变都具有较高的准确率,并且由于本文算法不对MPEG-2视频进行解压缩处理,而是通过GOP直接计算得到,因此镜头分割效率高,耗时少,计算量大大降低。

全文目录


摘要  3-5
ABSTRACT  5-9
第一章 绪论  9-23
  1.1 研究背景  9-10
  1.2 研究现状  10-21
    1.2.1 视频镜头分割技术简介  10
    1.2.2 视频镜头分割技术分类  10-12
    1.2.3 视频镜头分割技术算法  12-21
  1.3 论文主要创新特点  21-22
  1.4 论文结构  22-23
第二章 基础知识介绍  23-42
  2.1 卡方检测原理  23-25
    2.1.1 卡方检验基本思想  23-24
    2.1.2 卡方模型  24
    2.1.3 卡方应用领域  24-25
    2.1.4 卡方公式在本为中的推理  25
  2.2 MPEG 视频编码标准  25-32
    2.2.1 MPEG 简介  25-26
    2.2.2 MPEG 图像压缩原理  26-27
    2.2.3 MPEG 视频分层结构  27-30
    2.2.4 MPEG 运动补偿预测  30-31
    2.2.5 MPEG-2 视频帧结构  31-32
    2.2.6 播放顺序与编码顺序  32
  2.3 机器学习(Machine Learning)理论  32-41
    2.3.1 机器学习原理  32-33
    2.3.2 机器学习的主要策略  33-34
    2.3.3 机器学习系统的基本结构  34-35
    2.3.4 机器学习分类  35-39
    2.3.5 目前研究领域  39-40
    2.3.6 机器学习的思想在阈值动态设定算法中的应用  40-41
  2.4 本章小结  41-42
第三章 卡方检测算法、阈值动态设定算法和宏块类型统计特性分析方法研究  42-52
  3.1 I-帧亮度DC 分量直方图卡方检测算法研究  42-46
    3.1.1 DCT 变换与DC 分量  42-43
    3.1.2 I-帧的DC 分量  43
    3.1.3 I-帧DC 分量直方图卡方检测原理  43-44
    3.1.4 I-帧DC 分量直方图卡方检测算法步骤  44-46
  3.2 基于机器学习思想的阈值动态设定算法研究  46-48
    3.2.1 Dk阈值动态设定算法思想  46-48
    3.2.2 Dk阈值动态设定算法步骤  48
  3.3 宏块类型统计特性分析研究  48-51
    3.3.1 宏块类型信息提取  49-50
    3.3.2 相似度与相似度差  50
    3.3.3 宏块类型统计特性分析步骤  50-51
  3.4 本章小结  51-52
第四章 基于卡方检测和宏块类型统计的视频镜头边界检测算法研究  52-58
  4.1 算法基本思想  52-53
  4.2 算法数学模型  53-55
  4.3 算法整体框架  55-56
  4.4 算法总体步骤  56-57
  4.5 本章小结  57-58
第五章 算法仿真实验与分析  58-70
  5.1 实验条件  58
  5.2 算法可行性实验  58-64
    5.2.1 I-帧亮度DC 分量直方图卡方检测与Dk阈值设定  58-61
    5.2.2 相似度T(k)和相似度差Et(k)检测  61-63
    5.2.3 不同类型视频的镜头分割分析  63-64
  5.3 算法对比性实验  64-66
  5.4 算法误判/漏判实验分析  66-68
    5.4.1 新闻类视频误判/漏判分析  66-67
    5.4.2 电影类视频误判/漏判分析  67-68
    5.4.3 体育类视频误判/漏判分析  68
  5.5 本章小结  68-70
第六章 结束语  70-72
  6.1 本文创新工作  70
  6.2 未来展望  70-72
参考文献  72-76
致谢  76-77
攻读硕士期间已发表和已录用的论文  77-78
在研期间参加项目情况  78-80

相似论文

  1. 基于数据分布特征的文本分类研究,TP391.1
  2. 基于条件随机场的中文分词技术的研究与实现,TP391.1
  3. 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
  4. Android恶意软件静态检测方案的研究,TP309
  5. 监督主题模型的研究与应用,TP391.1
  6. 基于失真效应的图像质量评价与分类,TP391.41
  7. 基于学习的逆向运动学人体运动合成,TP391.41
  8. 基于内容的网页恶意代码检测的研究与实现,TP393.092
  9. 学术主页信息抽取系统的研究,TP393.092
  10. 社会化网络中的推荐算法及其应用,TP391.3
  11. 数据挖掘在邮件反垃圾系统中的应用,TP393.098
  12. 基于自学习的社会关系抽取的研究,TP391.1
  13. 基于统计与图模型的若干机器学习算法及其应用,TP181
  14. P2P流量识别方法研究,TP393.06
  15. 基于粗糙集和SVM的国防生综合素质测评方法研究,E075
  16. 基于SIFT特征和SVM的场景分类,TP391.41
  17. 基于稀疏编码与机器学习的图像内容识别算法研究,TP391.41
  18. 随机森林特征选择,TP311.13
  19. 互联网流量应用基准分类技术的研究,TP393.06
  20. 基于丰富特征和多核学习的蛋白质关系抽取,Q51
  21. 弥散张量成像的脑连接模式分析,R445.2

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com