学位论文 > 优秀研究生学位论文题录展示

基于语义的视频内容检索中模糊不确定性问题研究

作 者: 常军
导 师: 胡瑞敏
学 校: 武汉大学
专 业: 计算机应用
关键词: 视频内容检索 视频语义 不确定性
分类号: TP391.41
类 型: 博士论文
年 份: 2011年
下 载: 141次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近十几年来,随着计算机技术、网络通信技术和多媒体技术的飞速发展,视频信息处理的理论、方法和应用模式都有了巨大的变化,视频内容检索己成为多媒体信息技术研究和应用的活跃方向之一。视频语义中含有大量概念的、主观的成分,语义内容相当丰富,但视频图像的数字化表征,并不直观地体现其内容含义,视频语义信息的提取、理解和检索等重要环节均呈现出多样性和模糊性的特点,受限于当前图像理解技术的发展水平和对人类思维认知原理的揭示水平,基于语义的视频内容检索中不确定性仍是无法回避的关键难题,要在不确定性与确定性之间建立联系,从而使偏重主观定性的视频语义特征与偏重客观定量的视频视觉特征之间实现映射和转换仍需要面临许多挑战。本文对基于语义视频内容检索中关键环节所涉及的典型模糊不确定性问题开展研究:首先针对视频语义特征提取和分类时先验约束条件缺失问题和噪音样本、孤立样本等对语义对象智能分类的干扰问题进行研究;然后对多线索、多特征的复杂语义分类推理规则的冲突和不协调问题,及定性推理到定量推理的转换问题进行研究;以上述研究为基础,针对视频语义匹配中多粒度、多层次语义概念间关系匹配,以及语义相关性对检索的干扰问题进行研究。在基本理论模型和应用技术方法等方面取得了如下的成果和贡献:5.基于粗糙集属性约简的多分类模糊支持向量机视频语义提取过程中需要使用图像低层特征信息和先验约束条件进行智能分类和识别,因视频数据具有复杂性和时空多维性的突出特点,视频图像中诸多干扰因素,会造成分类识别所需的先验约束条件缺失,使目前许多分类方法失准,另一方面分类器训练样本中既存在噪音样本、孤立样本等干扰数据,也同时存在对分类边界无重要贡献的冗余数据。针对这些问题,本文将粗糙集属性约简原理与模糊支持向量分类器相结合,在分析和研究了模糊线性可分、近似模糊线性可分和模糊非线性模糊支持向量分类机的数学特性基础上,建立相应的分类函数模型并构造隶属函数,训练集经过属性约简处理后,减弱了噪音和孤点对分类的干扰,缩短了分类器训练时间,提高了多类别分类的精度。通过仿真实验验证,对UCI数据集中8组典型测试数据集分别采用此方法与1-r-1SVM、K-SVM. CS-SVM、FSVM方法对照,训练时间平均缩短了4.4%-34%,分类精度提高0.5%~7.65%。6.基于可能性测度和必然性测度的定量化模糊推理方法在理解和建立视频语义概念的过程中,需要以计算机能够实现的定量形式进行领域知识匹配和不确定推理,还需要面对多线索、多特征的复杂语义分类推理规则之间的冲突和不协调问题。针对这些问题,本文从可能性测度和必然性测度来出发,对定量化不确定性推理进行数学定义和描述,并从理论上证明和推导了有关性质,使其能够对给定命题进行数值转换和推理计算。还以包含度和相似度为基础,建立推理规则间协调度的量化评价关系,为识别复杂知识规则之间的冲突,进而消除推理时的矛盾提供了一种理论方法。7.基于WordNet的图像语义相似性度量方法;视频图像的语义在不同粒度、不同层次的抽象,可以蕴含多种语义概念关系,这些关系主要包括:局部与整体关系、上位与下位关系、同义关系等,当使用基于关键字进行语义匹配时,关键字本身难以直接体现概念间的多种关系。针对此问题,本文的研究借助WordNet的树形概念层次结构,提出依据词汇语义概念间的关系来组织标注关键词和检索关键词的思想,因概念树中两个结点之间有且仅有一条路径,路径的长度可以作为这两个概念的语义相似性的一种度量,从而将两幅图像间的语义相似度量转换成WordNet中词汇概念之间的路径距离,使图像语义概念之间关系得以体现,进而可实现其语义关系匹配。8.视频文档隐含语义相关性分析方法在视频片段的各帧之间,在语义结构的各层次之间均广泛存在着各种相关性,当使用向量空间形式表示和处理语义概念时,会产生同义与多义现象干扰检索结果的不利影响,其原因是表达语义概念的词汇数据之间存在着向量相关性,需要消除冗余的相关性,并要保留核心的语义内容。针对此问题,本文对隐含语义分析方法加以改进和扩展,提出视频特征词典空间的构建方法,以视频特征词典为基础,建立反映视频内容结构特征的视频文档集合矩阵,通过消减视频文档集合矩阵中的隐含相关向量,保留视频内容核心结构特征值,以达到消除相关性干扰的目的。经过TERCVID数据集进行仿真实验验证,对典型的17个语义项用本方法与对照的K-NN算法进行比较,本方法对其中70.59%的语义项检索效果优于对照算法,对17.65%的语义项检索效果与对照算法基本持平,取得了较好的效果。综上所述,本文以基于语义的视频内容检索为研究背景,对视频语义提取、领域知识推理、语义概念匹配等关键环节中所面临的几个典型模糊不确定性问题展开研究,在基本理论和应用技术方面为视频语义检索拓展了值得进一步深入探索和发展的途径,具有重要的理论意义和应用价值。

全文目录


论文创新点  5-6
摘要  6-8
Abstract  8-12
第一章 绪论  12-37
  1.1 引言  12-13
  1.2 研究背景与意义  13-15
  1.3 国内外相关研究综述  15-33
    1.3.1 视频内容检索技术研究的发展概况  15-18
    1.3.2 低层视觉特征提取技术  18-24
    1.3.3 语义提取及表示技术  24-29
    1.3.4 视频图像语义分类和检索技术  29-33
  1.4 目前研究中仍存在的关键问题  33-34
  1.5 论文的主要工作成果  34-36
  1.6 论文的内容组织  36-37
第二章 视频特征分类的不确定性处理  37-75
  2.1 引言  37-38
  2.2 粗糙集理论基础  38-50
    2.2.1 粗糙集理论的基本思想  38-39
    2.2.2 粗糙集的定义及基本性质  39-42
    2.2.3 粗糙集的特征  42-46
    2.2.4 知识约简  46-50
  2.3 模糊支持向量机分类器  50-63
    2.3.1 模糊分类中的模糊特征与表示  50-52
    2.3.2 模糊线性可分模糊支持向量分类机  52-55
    2.3.3 近似模糊线性可分模糊支持向量分类机  55-59
    2.3.4 模糊非线性模糊支持向量分类机  59-63
  2.4 基于粗糙集属性约简的多分类模糊支持向量机(RPR-MSVM)  63-73
    2.4.1 粗糙集与支持向量机的结合途径分析  63-65
    2.4.2 多类分类模糊支持向量机  65-67
    2.4.3 训练集属性约简  67-68
    2.4.4 实验结果与分析  68-73
  2.5 本章小结  73-75
第三章 视频内容的语义描述和不确定推理  75-102
  3.1 引言  75-76
  3.2 视频语义的形式化表示  76-80
    3.2.1 视觉词汇变量  76-77
    3.2.2 视觉词汇变量中的语义规则  77
    3.2.3 视觉词汇变量中的句法规则  77-79
    3.2.4 视频对象间的关系表示  79-80
  3.3 定量化不确定推理  80-97
    3.3.1 定量推理方法的分类  81-82
    3.3.2 模糊推理的数学模型  82-84
    3.3.3 可能性测度与必然性测度  84-86
    3.3.4 基于可能性测度和必然性测度的模糊推理  86-93
    3.3.5 基于模糊运算的模糊推理  93-97
  3.4 模糊推理规则的协调性与矛盾规则的排除  97-100
  3.5 本章小结  100-102
第四章 视频语义相似性度量与检索  102-124
  4.1 引言  102-103
  4.2 相似性度量  103-108
    4.2.1 相似性度量准则  103
    4.2.2 相似性匹配的分类  103-104
    4.2.3 相似性度量方法  104-108
  4.3 视频语义相似性度量  108-112
    4.3.1 语义相似性度量  108-109
    4.3.2 多特征综合的视频语义相似性度量  109-110
    4.3.3 多特征的归一化处理  110-112
  4.4 基于WORONET的图像语义相似性度量  112-114
    4.4.1 关键词间的语义关系分类  112-113
    4.4.2 图像间语义相似性计算  113-114
  4.5 视频文档隐含语义相关性  114-122
    4.5.1 隐含语义分析原理  115-117
    4.5.2 视频特征词典的建立  117
    4.5.3 视频文档集合矩阵的建立  117-118
    4.5.4 视频特征的自相关和互相关性分析  118-120
    4.5.5 隐含维数S的影响分析  120
    4.5.6 实验结果与分析  120-122
  4.6 本章小结  122-124
第五章 总结与展望  124-127
  5.1 本文工作成果与创新  124-125
  5.2 研究前景展望  125-127
参考文献  127-134
科研成果  134-136
致谢  136

相似论文

  1. 小型望远镜防抖系统的设计与工程实现,TH743
  2. 离散切换系统稳定性分析及控制器设计,TP13
  3. 随机时滞系统的稳定性分析与鲁棒控制器设计,TP13
  4. 时滞系统的稳定性分析,TP13
  5. 污染场地健康与生态风险评价研究,X820.4
  6. 基于不确定性系统研究方法的高校学生学习成绩分析与预测,G642.4
  7. 不确定性和元小说:《马赛克人》的后现代主义特点研究,I712.074
  8. 信息规避研究,G201
  9. 基于不确定性灾害因素的深井合理经济开采深度分析,TD823
  10. 转型时期的社会焦虑研究,C912.6
  11. 两类不确定系统基于网络的鲁棒滤波,O231
  12. 微粒群算法的改进与应用研究,TP18
  13. 论《第二十二条军规》中的不确定性,I712.074
  14. 论司法的确定性,D916
  15. 不确定移动对象的异常点检测技术,TP311.13
  16. 基于LMI算法的倒立摆系统鲁棒H_∞控制研究,TP13
  17. 笛卡尔对确定性的追求,B565.21
  18. 一类不确定广义双线性系统的鲁棒H_∞控制,TP13
  19. 时滞线性系统的鲁棒容错控制器设计,TP13
  20. 长时延不确定网络控制系统的保性能控制,TP273
  21. 熵在经济预测模型评价中的应用,F201

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com