学位论文 > 优秀研究生学位论文题录展示

基于内容的视频检索关键技术研究

作 者: 肖永良
导 师: 夏利民
学 校: 中南大学
专 业: 控制科学与工程
关键词: 视频检索 保局投影 多核支持向量机 多变量时间序列 局部联配 相似度模型
分类号: TP391.41
类 型: 博士论文
年 份: 2010年
下 载: 379次
引 用: 0次
阅 读: 论文下载
 

内容摘要


计算机技术、数字多媒体技术和因特网技术的迅速发展导致了大量视频的出现,如何有效地从众多的视频数据库中检索出感兴趣的视频片段是目前一个相当重要且富有挑战性的研究课题。本文围绕基于内容的视频检索的几项关键技术进行了深入研究。主要创新性工作如下:(1)提出了一种基于改进的保局投影视频特征提取方法。针对保局投影变换需预先指定降维维数以及近邻参数等缺陷,提出了根据降维前后的结构误差自动确定最佳降维维数的新方法,结合各个数据点邻域的统计特性实现了近邻参数的动态选择。为了克服单一特征无法有效表征视频内容的缺陷,提出融合视频的颜色、纹理和形状特征构建原始视频特征,并利用改进的保局投影方法进行视频特征提取。(2)提出了一种基于局部多核支持向量机的视频镜头边界检测方法。利用视频图像相邻帧的时空信息构建用于镜头边界检测的中间特征;针对基于全局优化的多核支持向量机检测精度不高的问题,采用局部多核支持向量机检测视频镜头边界;利用局部敏感哈希算法将视频图像样本投影至哈希子空间,结合多核学习方法为各个哈希子空间建立局部多核支持向量机;利用SMOTE采样技术解决支持向量机学习中视频图像边界帧和普通帧样本不平衡问题。(3)提出了一种基于多变量时间序列分割的关键帧提取方法。首先提出了一种改进的多变量时间序列分割方法,根据子序列的段间离散度和段内离散度定义分割代价函数,解决了传统多变量时间序列分割方法中代价函数计算复杂及分段数难以确定的缺陷;为了获得最优分割点,提出了分割与合并相结合的序列分割策略。在此基础上,利用改进的多变量时间分割方法将视频镜头分割为多个内容相似的子镜头,提取与子镜头视频帧中心最近的视频帧为关键帧。(4)提出了一种根据镜头模式相似性和视觉相似性度量镜头相似性的方法。为了解决镜头内容相同而视频特征相差较大的问题,在视频特征的基础上结合镜头变化趋势提出了镜头模式相似性概念;利用动态时间归正技术计算镜头模式相似性,克服了镜头包含帧数目以及特征强度不一致问题,并采用下界函数加速模式相似性的求解过程;考虑到镜头中关键帧的重要程度,提出比例加权Kuhn-Munkres算法;结合比例加权Kuhn-Munkres算法和最长公共子序列算法计算镜头的视觉相似性。对镜头模式相似性和视觉相似性进行加权处理得到镜头之间的相似性。(5)提出了一种基于片段的视频检索方法。针对传统的滑动窗口视频片段分割不准确问题,提出了基于局部联配FASTA算法的相似视频片段分割方法:为了解决相似片段中的伪相似问题,采用最大匹配Hungarian算法删除伪相似片段得到真正的相似片段;对视频片段的视觉因子、顺序因子、跨度因子和干扰因子进行加权处理得到视频片段相似性。最后,分析了当前基于内容的视频检索研究中存在的问题,指出了进一步的研究方向。

全文目录


摘要  4-6
ABSTRACT  6-9
目录  9-12
第一章 绪论  12-27
  1.1 本文的研究背景  12-13
  1.2 本文的研究目的及意义  13-14
  1.3 国内外研究现状和存在的主要问题  14-24
    1.3.1 国内外研究现状  15-23
    1.3.2 存在的主要问题  23-24
  1.4 本文的主要研究内容  24-26
  1.5 本文的章节安排  26-27
第二章 基于改进的保局投影视频特征提取  27-42
  2.1 概述  27-28
  2.2 保局投影  28-29
  2.3 改进的保局投影  29-32
    2.3.1 确定邻域参数  30-31
    2.3.2 确定最佳维数  31-32
  2.4 基于改进的保局投影视频特征提取  32-36
    2.4.1 原始特征  32-35
    2.4.2 基于改进的保局投影视频特征提取算法  35-36
  2.5 实验结果与分析  36-41
    2.5.1 评价指标  36-37
    2.5.2 实验结果与分析  37-41
  2.6 本章小结  41-42
第三章 基于局部多核支持向量机的镜头边界检测  42-60
  3.1 概述  42-43
  3.2 相关工作  43-47
    3.2.1 镜头转换类型  43-44
    3.2.2 镜头边界检测方法  44-47
  3.3 多核支持向量机  47-49
    3.3.1 支持向量机  47-48
    3.3.2 多核支持向量机  48-49
  3.4 局部多核支持向量机  49-52
    3.4.1 样本哈希子空间  49-50
    3.4.2 构建平衡数据集  50-51
    3.4.3 局部多核支持向量机  51-52
  3.5 基于局部多核支持向量机的视频镜头边界检测  52-55
    3.5.1 视频时空特征  52-53
    3.5.2 基于局部多核支持向量机的视频镜头边界检测方法  53-55
  3.6 实验结果与分析  55-59
  3.7 本章小结  59-60
第四章 基于多变量时间序列分割的镜头关键帧提取  60-75
  4.1 概述  60-61
  4.2 相关工作  61-63
  4.3 多变量时间序列分割算法  63-65
  4.4 改进的多变量时间序列分割算法(IMTS)  65-70
    4.4.1 代价函数  66-68
    4.4.2 序列分割策略  68-69
    4.4.3 改进的多变量时间序列分割算法  69-70
  4.5 基于IMTS的镜头关键帧提取  70
  4.6 实验结果与分析  70-74
    4.6.1 评价指标  70-71
    4.6.2 实验结果与分析  71-74
  4.7 本章小结  74-75
第五章 镜头相似性度量  75-92
  5.1 概述  75-77
  5.2 镜头模式相似性  77-82
    5.2.1 动态时间归正技术(DTW)  78-80
    5.2.2 基于下界函数的DTW镜头模式相似性  80-82
  5.3 镜头视觉相似性  82-87
    5.3.1 镜头特征相似性  83-85
      5.3.1.1 Kuhn-Munkres算法  83
      5.3.1.2 基于比例加权Kuhn-Munkres的特征相似性  83-85
    5.3.2 镜头时间相似性  85-86
    5.3.3 镜头视觉相似性  86-87
  5.4 镜头相似性  87
  5.5 实验结果与分析  87-91
    5.5.1 评价指标  87-88
    5.5.2 实验结果与分析  88-91
  5.6 本章小结  91-92
第六章 基于片段的视频检索  92-115
  6.1 概述  92-95
  6.2 相似视频查询  95-96
  6.3 相似视频片段分割  96-104
    6.3.1 局部联配FASTA算法  96-100
    6.3.2 基于FASTA的相似视频片段分割  100-102
    6.3.3 伪相似视频片段删除  102-104
  6.4 视频片段相似性  104-108
    6.4.1 视觉因子  105-106
    6.4.2 顺序因子  106-107
    6.4.3 跨度因子  107
    6.4.4 干扰因子  107-108
    6.4.5 视频片段相似性  108
  6.5 基于片段的视频检索  108-109
  6.6 实验与结果分析  109-114
    6.6.1 评价指标  109
    6.6.2 实验结果与分析  109-114
  6.7 本章小结  114-115
第七章 结束语  115-118
  7.1 本论文工作总结  115-116
  7.2 进一步研究工作  116-118
参考文献  118-129
致谢  129-130
攻读博士学位期间的主要研究成果  130

相似论文

  1. 沈阳电视台视频素材采编系统软件的设计与实现,TP311.52
  2. 基于压缩域特征的视频检索技术研究,TP391.41
  3. 基于LPP算法的人脸识别技术研究,TP391.41
  4. 基于帧内编码地理信息视频系统的设计与实现,TP391.41
  5. 基于MPEG-7的视频数据库存储检索技术研究,TP391.41
  6. 掌纹和人脸识别算法的研究与实现,TP391.41
  7. 基于业务流特征的快速视频识别算法与系统设计,TP391.41
  8. 基于MPEG足球视频场景切换检索的研究,TN919.81
  9. 多变量时间序列预测与储备池优化方法研究,TP181
  10. 基于子空间算法的人脸识别,TP391.41
  11. 基于SVM的视频检索系统的研究和实现,TP391.41
  12. 支持语义的分布式视频检索系统的设计与实现,TP391.41
  13. 基于MPEG-7低层特征的视频检索系统,TP391.41
  14. 基于内容的压缩域视频挖掘关键技术研究,TP391.41
  15. 支持语义的视频检索技术研究,TP391.41
  16. 证券价格的几种预测方法及实证研究,F830.91
  17. 视频语义信息提取的研究,TP391.41
  18. 多变量相空间重构及其在故障诊断中的应用,TP206.3
  19. 基于统计的人脸识别方法研究,TP391.41
  20. 视频检索中概念检测技术的研究与应用,TP391.41
  21. 多元混沌时间序列相关性分析及预测方法研究,O211.61

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com