学位论文 > 优秀研究生学位论文题录展示

基于时空变化的视频内容分析方法研究

作 者: 蒋呈明
导 师: 蒋兴浩;孙锬锋
学 校: 上海交通大学
专 业: 通信与信息系统
关键词: 视频内容分析 时空切片 变化直方图描述子 扩散式协同训练 多模态特征
分类号: TP391.41
类 型: 硕士论文
年 份: 2012年
下 载: 81次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网和多媒体技术的不断发展,网络视频已经成为了网络用户获取信息、学习知识和娱乐休闲的最主要的方式之一。在此背景下,近年来视频内容分析成为了计算机视觉领域中的研究热点之一。视频内容分析算法,是从图像内容分析引申发展而来,旨在为了让计算机自动地对输入视频进行内容分析,从而理解视频内容的语义,达到分类和检索的目的。视频内容分析算法在医学医疗,安全控制,军事科技等领域都有着广泛的应用背景。本文着重研究视频内容分析方法,在视频特征提取、语义标记和分析架构方面做出一定量的创新性工作。首先在特征提取方面,提出了一种新的针对视频内容自动识别与分类的特征——空时变化程度直方图描述子,简称变化直方图描述子(Variation Histogram Descriptor)的构建方法,实现对视频内容语义进行快速、准确地识别与分类。该方法首先引入了已有的视频时空切片的概念,然后具体给出了适用于该算法的关键网格来获取时空切片,同时详细定义了在时空切片上构造视频变化程度直方图描述子的实现步骤。该算法区别于从关键帧中提取视频的内容特征,而是充分考虑了视频在时间上和空间上的变化程度,对以镜头为单位的整段视频进行分析;特征提取的过程不依赖于视频的关键点,因此特征提取的时间消耗不随视频复杂度的提高而增加。实验部分证明这种时空特征能更全面地描述视频在时间和空间上的内在关系,对人物具体运动达到准确地分类,与同类算法进行对比,在时间消耗和分类准确率方面均表现出了更良好的性能。同时,该算法联合音频特征能对各类语义达到一个比较理想的分类效果。在语义标记方面,本文应用了半监督学习的方法实现了对网络视频数据的标记。本文的半监督学习方法是一种基于标准协同训练方法的改进,适用于视频库大小动态变化的情况,该方法称为扩散式协同训练算法(Pervasive Co-training Method)。与此同时,在分析架构方面,本文设计并应用一种基于多模态特征的网络视频过滤方法,实现对网络视频的安全监管。该方法对从网络视频中提取三大类的视频特征,分别针对音频特征、运动和颜色以及空间和时间特征,递进地对视频进行过滤。通过对视频中不良场景的定义,包括恐怖、暴力和色情语义,以检测网络视频内容中潜在的不良信息。实验证明该方法有效地提高了不良视频检测和分类的准确率。

全文目录


摘要  3-5
Abstract  5-7
目录  7-10
第一章 绪论  10-16
  1.1 研究背景及意义  10-12
  1.2 国内外研究现状  12-14
  1.3 本文的创新性工作  14
  1.4 本文的结构安排  14-16
第二章 相关理论基础  16-32
  2.1 引言  16
  2.2 多模态特征  16-25
    2.2.1 基于文本的分类方法  16-17
    2.2.2 基于音频的分类方法  17-18
    2.2.3 基于视觉的分类方法  18-24
    2.2.4 CBIR 与CBVR  24-25
  2.3 BOVW 模型  25-27
  2.4 SVM  27-30
    2.4.1 SVM 的发展过程  27-28
    2.4.2 SVM 的主要思想方法  28
    2.4.3 SVM 的两类和多类分类  28-29
    2.4.4 SVM 存在的问题  29-30
  2.5 半监督学习  30-31
  2.6 本章小结  31-32
第三章 视频时空切片区域变化程度的研究  32-53
  3.1 引言  32
  3.2 时空切片与空时特征  32
  3.3 局部区域变化程度  32-36
    3.3.1 时空立方体  32-33
    3.3.2 结构张量  33-34
    3.3.3 变化直方图描述子  34-36
  3.4 音频签名  36-37
  3.5 分类策略  37-39
  3.6 实验结果及分析  39-52
    3.6.1 实验设计  40-42
    3.6.2 特征提取时间开销  42-43
    3.6.3 单特征对比实验  43-47
    3.6.4 联合音频的组合特征对比实验  47-52
  3.7 本章小结  52-53
第四章 应用半监督学习的多模态内容分层安全过滤方法  53-67
  4.1 引言  53-54
  4.2 标准半监督学习算法及其改进  54-58
    4.2.1 基本假设  54
    4.2.2 半监督学习模型  54-55
    4.2.3 低密度分割算法  55-56
    4.2.4 标准协同训练算法  56-57
    4.2.5 改进的扩散式协同训练算法  57-58
  4.3 多模态特征模型  58-62
    4.3.1 音频特征  58-59
    4.3.2 肤色覆盖率和颜色描述子  59-60
    4.3.3 多时空特征特征并列检测  60-62
  4.4 实验结果和分析  62-66
    4.4.1 实验设计  62-64
    4.4.2 内容安全过滤实验结果  64-66
  4.5 本章小结  66-67
第五章 总结与展望  67-69
  5.1 论文总结  67-68
  5.2 工作展望  68-69
参考文献  69-74
致谢  74-75
攻读硕士学位期间发表或录用的论文  75
攻读硕士学位期间参加的课题与项目  75-76
附件  76-78

相似论文

  1. 基于内容的视频检索研究,TP391.41
  2. 基于多特征组合和SVM的视频内容自动分类算法研究,TP391.41
  3. 基于多模态特征的垃圾邮件过滤技术研究,TP393.098
  4. 多模态视频信息检索,TP391.3
  5. 面向家庭视频的视频摘要技术的研究,TP391.4
  6. 基于隐马尔可夫模型的视频内容分析与表达的研究,TN919.8
  7. 体育视频中慢镜头探测技术的研究与实现,TN948.1
  8. 基于运动特征的数字视频检索方法研究,TP391.41
  9. 基于内容的视频检索研究与实现,TP391.3
  10. 基于运动轨迹的语义视频对象检测与跟踪,TP274.4
  11. 视频的内容分析与检索技术及其教育应用研究,TP391.3
  12. 基于新闻视频字幕的检测与提取分析,TP391.41
  13. 城市道路交通网络多模态动态性建模研究,N945.12
  14. 感知,思维,行为:层次化的视频内容分析技术研究,TP391.41
  15. 基于小波神经网络理论的VOCR与HOCR技术研究,TP391.41
  16. 基于多模态信息的新闻视频内容分析技术研究,TP391.41
  17. 视频内容结构分析与总结的准则和算法,TN911.7
  18. 视频摘要技术的研究与实现,TN911.73
  19. 家用视频内容分析方法研究,TN919.81
  20. 网络电视中的关键技术研究,TN943

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com