学位论文 > 优秀研究生学位论文题录展示

多特征融合视频复制检测关键技术研究

作 者: 陈秀新
导 师: 贾克斌
学 校: 北京工业大学
专 业: 电路与系统
关键词: 视频复制检测 颜色时序特征曲线 三维量化颜色直方图 仿射不变区域 方向可控金字塔 Tri-training
分类号: TP391.41
类 型: 博士论文
年 份: 2013年
下 载: 77次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着数字视频采集设备的广泛应用和计算机网络技术的飞速发展,网络上的视频数据呈现爆炸性增长,视频复制检测技术能够在众多视频数据中快速高效地检测到具有相同内容的视频信息,因此在数字视频版权保护、视频管理与索引以及媒体跟踪等领域具有巨大的应用需求和重要的应用价值。近年来,基于内容的视频复制检测技术已成为多媒体信息处理领域研究的热点。现有的视频复制检测技术存在运算量大、查全率和准确率低、鲁棒性差、应用范围受限等诸多问题,研究快速高效的视频复制检测方法迫在眉睫。在上述背景下,本文对视频复制检测关键技术进行了深入研究,完成的主要工作与贡献包括:1.提出了基于颜色时序特征曲线的视频复制检测方法(Video CopyDetection Based on Spatial-tempral Color Feature Curves, SCFC-VCD)。针对视频复制检测普遍存在的计算量大的问题,提出了基于时序特征曲线的检测方法。首先,对视频帧进行分割,提取各子区域颜色Y分量和U分量的均值,按照视频帧的先后顺序组成视频的特征曲线;然后,将提取出的特征曲线与待匹配视频的特征曲线进行匹配。为了去除视频亮度和色度整体漂移带来的影响,提出了基于差值曲线的相似性匹配算法;为了去除突变干扰的影响,提出了异常因子(ExceptionFactor)来解决;为了处理不同时间尺度的视频匹配问题,提出了改进的动态时间规划匹配算法。实验结果证明,SCFC-VCD方法运算量非常小、检索速度比一般的方法快,对于广告等画面变化较频繁的视频具有很好的检测效果,且能够抵抗常见的干扰。对于电视剧等画面变化率比较低的视频,SCFC-VCD方法可以快速有效地过滤掉大部分不相关的视频,从而大大减小了后续基于关键帧特征处理的运算量。2.提出了基于三维量化颜色直方图的视频复制检测方法(Three-dimentionalQuantized Color Histogram Method, TQCH)。针对颜色直方图在量化边界处误差大、对颜色变化过度敏感等问题,提出了三维量化颜色直方图方法。首先,对HSV颜色空间的关键帧颜色值进行非均匀量化;然后,统计其颜色直方图。为了降低量化边界处颜色值的误差,对颜色直方图沿H分量方向将相邻的两个值相加,得到三维量化颜色直方图,用来代表关键帧的颜色特征。最后,提出了相应的匹配方法。实验结果表明,TQCH方法有效表示了关键帧的颜色特征,对于常见的彩色图像,其查全率和准确率高于现有的其他颜色特征检索方法,并且对于常见干扰具有鲁棒性。3.提出了基于仿射不变连通区域的视频复制检测方法(ConnectedComponent Based Affine Invariant Region Method,CCB-Affine)。针对现有形状特征提取方法存在的特征数目少、可重复性及鲁棒性差等问题,提出了一种新的仿射不变区域提取和描述方法。在检测子中,首先对关键帧图像预处理;然后,找到关键帧中灰度值相同的点所组成的连通区域,将灰度值差小于阈值的相邻连通区域分别进行合并,取满足条件的最后一次合并结果为仿射不变区域;最后,通过一定的策略将检测结果中不满足条件的区域去除,得到最终的仿射不变区域。在区域描述子部分,基于归一化复数中心矩构造了6个不变矩。实验结果表明,CCB-Affine方法可有效提取图像中的形状特征,并可抵抗包括视角变化在内的各种常见干扰的影响,与其他方法相比具有更好的鲁棒性,且提取的特征数目足够多。4.提出了基于方向可控金字塔二值图像投影的视频复制检测方法(SteerablePyramid Binary Image Projection Method, SP-BIP)。为了提取关键帧图像的多尺度、多方向纹理特征,提出了方向可控金字塔二值图像投影方法。首先,对灰度化后的关键帧图像进行方向归一化,并进行方向可控金字塔分解,对各子带图像通过自适应阈值进行二值化;然后,计算子带图像的归一化行和列投影向量,作为子带图像的纹理特征。在特征匹配上,采用向量相交匹配方法。实验结果表明,SP-BIP方法可有效提取关键帧中的多尺度、多方向的纹理特征,优于小波变换等纹理特征提取方法,并对一些常见干扰具有鲁棒性。5.提出了基于Tri-training的多特征融合视频复制检测方法(Tri-trainingBased Multi-feature Video Copy Detection,TBM-VCD)。为了有效融合视频的多种视觉特征,提出了新的多特征融合方案。通过Tri-training半监督学习方法将视频的颜色、形状和纹理特征进行了有效的融合,弥补了单一特征在应用中的缺点。通过三个分类器的协同训练,提高了视频复制检测的查全率与准确率,扩大了应用范围。实验结果表明,本文提出的视频复制检测方法具有速度快、查全率与准确率高、应用范围广等优点。与使用单一特征的视频复制检测方法相比,TBM-VCD方法的查全率与准确率具有明显优势,很好地满足了视频复制检测的需求。

全文目录


摘要  4-6
Abstract  6-14
第1章 绪论  14-34
  1.1 引言  14-15
  1.2 视频复制检测技术及研究意义  15-17
  1.3 视频复制检测技术研究现状  17-29
    1.3.1 视频的静态特征  17-27
    1.3.2 视频的动态特征  27-28
    1.3.3 视频特征的匹配  28
    1.3.4 视频复制检测算法评价标准  28-29
    1.3.5 存在的问题  29
  1.4 本课题来源及主要研究内容  29-31
  1.5 本论文结构  31-34
第2章 基于颜色时序特征曲线的视频复制检测  34-50
  2.1 引言  34-35
  2.2 视频颜色时序特征曲线的提取  35-38
    2.2.1 颜色空间的选取  35-36
    2.2.2 视频帧分块  36
    2.2.3 视频颜色时序特征曲线的获取  36-38
  2.3 视频颜色时序特征曲线的匹配  38-44
    2.3.1 直接匹配法  38-40
    2.3.2 差值曲线匹配方法  40-41
    2.3.3 实验结果与分析  41-44
  2.4 基于改进动态时间规划的快速匹配  44-49
    2.4.1 问题的提出  44-45
    2.4.2 改进的动态时间规划算法  45-46
    2.4.3 实验结果与分析  46-49
  2.5 本章小结  49-50
第3章 基于三维量化颜色直方图的视频复制检测  50-64
  3.1 引言  50
  3.2 基于子片段的视频关键帧提取  50-54
    3.2.1 子片段划分  50-51
    3.2.2 关键帧提取  51
    3.2.3 关键帧提取试验结果与分析  51-54
  3.3 三维量化颜色直方图提取  54-58
  3.4 三维量化颜色直方图匹配  58
  3.5 实验结果与分析  58-63
  3.6 本章小结  63-64
第4章 基于仿射不变连通区域的视频复制检测  64-76
  4.1 引言  64
  4.2 局部不变特征技术  64-65
  4.3 关键帧仿射不变形状特征提取与描述  65-70
    4.3.1 关键帧预处理  65-67
    4.3.2 形状区域提取子  67-69
    4.3.3 形状特征描述子  69-70
  4.4 关键帧仿射不变形状特征匹配  70
  4.5 实验结果与分析  70-75
  4.6 本章小结  75-76
第5章 基于方向可控金字塔二值图像投影的视频复制检测  76-88
  5.1 引言  76
  5.2 SP-BIP 方法概述  76-77
  5.3 方向可控金字塔特征提取  77-84
    5.3.1 方向可控金字塔技术  77-80
    5.3.2 方向归一化的实现  80-82
    5.3.3 方向可控金字塔二值图像投影  82-84
  5.4 方向可控金字塔特征匹配  84
  5.5 实验结果与分析  84-87
  5.6 本章小结  87-88
第6章 基于 Tri-training 的多特征融合视频复制检测  88-98
  6.1 引言  88
  6.2 Tri-training 半监督学习  88-89
    6.2.1 半监督学习  88-89
    6.2.2 Tri-training 算法  89
  6.3 基于 Tri-training 的视频多特征融合  89-92
    6.3.1 基于 Tri-training 算法的视频多特征融合工作流程  89-90
    6.3.2 TBM-VCD 方法实现  90-92
  6.4 实验结果与分析  92-97
  6.5 本章小结  97-98
第7章 总结与展望  98-102
  7.1 总结  98-99
  7.2 展望  99-102
参考文献  102-110
攻读博士学位期间取得的学术成果及科研工作  110-112
致谢  112

相似论文

  1. 基于半监督SVM的入侵检测研究,TP393.08
  2. 覆盖网络的优化与半监督学习,TP18
  3. 抗几何攻击鲁棒图像水印方法研究,TP309.7
  4. 半监督协同训练算法的研究,TP18
  5. 基于正例和无标记样例学习研究,TP391.41
  6. 虹膜识别特征提取与表达的理论和方法研究,TP391.4
  7. 基于Tri-training的半监督学习算法研究,TP181
  8. 协同学习研究及其在分类问题中的应用,TP18
  9. 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
  10. 用于检索的人脸特征提取与匹配算法研究,TP391.41
  11. 图像拼接技术研究,TP391.41
  12. 空中目标与背景的红外图像仿真技术研究,TP391.41
  13. 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
  14. 双传感器图像联合目标检测及系统实现研究,TP391.41
  15. 雾天或背光条件下图像清晰化算法研究及硬件实现,TP391.41
  16. 基于纹理特征的视频编码技术研究,TP391.41
  17. Q学习在基于内容图像检索技术中的应用,TP391.41
  18. 基于内容的服装图像检索技术研究及实现,TP391.41
  19. 电子稳像系统中旋转稳像算法研究,TP391.41
  20. 图像的稀疏表示及编码模型研究,TP391.41
  21. 基于感兴趣信息的高光谱图像压缩技术研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com