学位论文 > 优秀研究生学位论文题录展示

基于弱随机映射的目标检索技术研究

作 者: 赵永威
导 师: 李弼程
学 校: 解放军信息工程大学
专 业: 信号与信息处理
关键词: 目标检索 视觉词典法 精确欧式位置敏感哈希 弱随机化视觉词典组 查询扩展 语言模型 上下文语义信息 K-L散度
分类号: TP391.41
类 型: 硕士论文
年 份: 2012年
下 载: 20次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,随着互联网和多媒体技术的迅猛发展,使得多媒体数据呈“爆炸式”增长,形成了海量的信息环境。面对海量的图像数据,人们往往对其中的一些具体目标感兴趣,因此,如何准确、高效地从中检索出包含用户感兴趣目标的图像已成为亟待解决的问题。论文主要对目标检索技术进行研究,其贡献体现在如下三个方面:(1)在目标检索领域,当前主流的解决方案是视觉词典法(Bag of Visual Words,BoVW),然而,传统的BoVW方法具有时间效率低、内存消耗大以及视觉单词同义性和歧义性等问题。为此,本文提出了一种弱随机化视觉词典组模型。该模型首先采用精确欧氏位置敏感哈希(Exact Euclidean Locality Sensitive Hashing, E~2LSH)对训练图像库的SIFT特征点进行聚类;然后,借鉴随机森林思想对哈希函数的选取进行有效地监督以降低E~2LSH算法本身的随机性;最后,采用多个哈希表生成多个视觉词典构建弱随机化视觉词典组,进一步增强视觉词典的区分性。实验结果表明,较之传统的聚类算法,该模型能取得更好的聚类效果,增强了视觉单词的独特性,并提高了视觉词典生成的效率。(2)结合弱随机化视觉词典组和查询扩展技术,提出了一种基于弱随机化视觉词典组和查询扩展的目标检索方法。首先,该方法在由E~2LSH映射完成图像特征点与视觉单词的匹配的同时,采用tf-idf算法对视觉单词重新分配权重来构建视觉词汇直方图;然后,针对内存消耗大的问题,又将图像的直方图特征库存为索引文件,而不再直接进行内存操作;最后,引入一种平均查询扩展策略(Average Query Expansion)来丰富初始目标区域的信息量以进一步提高检索性能。实验结果表明该方法能够较大地提高目标检索精度,获取更多与查询目标相关的图像,同时,对大规模数据库有较好的适用性。(3)为更好地利用视觉单词间的空间信息和目标区域的上下文信息,结合弱随机化视觉词典组和上下文语义信息,提出了一种基于弱随机化视觉词典组和上下文语义信息的目标检索方法。该方法在语言模型(Language Model, LM)的基础上,加入了各视觉单词的空间位置信息,并利用目标区域周围的视觉单元构建了包含目标上下文语义信息的目标模型;然后,引入K-L散度(Kullback-Leibler divergence)进行相似性度量完成目标检索。实验结果表明该方法对查询目标区域模糊、凌乱和部分被遮挡的情况表现良好,能够进一步增强目标检索性能。总之,在模型方面,通过对随机映射的扩展和改进,使得生成的视觉词典的区分性更强、识别率更高,具有可扩展性;在关键技术方面,引入查询扩展和上下文语义信息,并与弱随机化视觉词典组相结合,形成新型目标检索技术,提高了模型和相关算法的鲁棒性,使得目标检索系统在复杂环境下依然保持良好的性能。

全文目录


表目录  6-7
图目录  7-8
摘要  8-9
ABSTRACT  9-11
第一章 绪论  11-21
  1.1 课题背景及研究意义  11-12
  1.2 国内外研究现状  12-18
    1.2.1 图像特征提取  12-14
    1.2.2 索引的构建  14-16
    1.2.3 相似性度量  16-17
    1.2.4 应用研究现状  17-18
  1.3 目标检索技术研究存在的问题和难点  18-19
  1.4 论文的工作和组织  19-21
    1.4.1 论文主要工作  19-20
    1.4.2 论文组织结构  20-21
第二章 弱随机化视觉词典组模型  21-37
  2.1 视觉词典法  21-27
    2.1.1 SIFT 特征提取  21-25
    2.1.2 视觉词典的生成  25-27
  2.2 弱随机化视觉词典组模型原理分析  27-28
  2.3 E~2LSH 算法和随机森林算法  28-32
    2.3.1 E~2LSH 基本定义  29-30
    2.3.2 E~2LSH 哈希原理  30-31
    2.3.3 随机森林算法  31-32
  2.4 弱随机化视觉词典组  32-34
  2.5 实验性能分析  34-36
  2.6 本章小结  36-37
第三章 基于弱随机化视觉词典组和查询扩展的目标检索  37-46
  3.1 基于弱随机化视觉词典组和查询扩展的目标检索原理分析  37-38
  3.2 查询扩展技术  38-39
  3.3 基于弱随机化视觉词典组和查询扩展的目标检索  39-42
    3.3.1 基于弱随机化视觉词典组和查询扩展的目标检索流程  39-40
    3.3.2 视觉词汇分布直方图  40-41
    3.3.3 相似性度量与平均查询扩展  41-42
  3.4 实验结果与性能分析  42-45
    3.4.1 实验设置与性能评价  42-43
    3.4.2 实验结果与分析  43-45
  3.5 本章小结  45-46
第四章 基于弱随机化视觉词典组和上下文语义信息的目标检索  46-58
  4.1 基于弱随机化视觉词典组和上下文语义信息的目标检索原理分析  46-48
  4.2 语言模型技术  48-49
  4.3 基于弱随机化视觉词典组和上下文语义信息的目标检索  49-54
    4.3.1 基于弱随机化视觉词典组和上下文语义信息的目标检索流程  49-50
    4.3.2 上下文语义信息目标模型的构建  50-52
    4.3.3 相似性度量  52-54
  4.4 实验结果与性能分析  54-57
    4.4.1 参数的影响  54-55
    4.4.2 实验性能分析  55-57
  4.5 本章小结  57-58
第五章 总结与展望  58-60
  5.1 本文工作总结  58-59
  5.2 下一步研究展望  59-60
参考文献  60-66
作者简历 攻读硕士学位期间完成的主要工作  66-67
致谢  67

相似论文

  1. 统计机器翻译中结构转换技术的研究,TP391.2
  2. 词义消歧语料库自动获取方法研究,TP391.1
  3. 生物医学领域检索系统查询扩展技术研究,TP391.3
  4. 针对零膨胀超散度计数数据的统计推断,C81
  5. 网络搜索引擎的相关技术研究,G354
  6. 基于动态自适应语言模型的手机中文输入系统的研究与实现,TP391.14
  7. 基于查询扩展的信息抽取技术研究及应用,TP391.1
  8. 关于树上马尔可夫链场的若干强偏差定理,O211.62
  9. 基于本体的教学资源语义检索研究,TP391.3
  10. 关于f-散度与Bregman散度,O174.12
  11. 英汉跨语言问答系统中的文档语义检索,TP391.1
  12. 广告搜索中的查询处理算法,TP391.3
  13. 基于本体的地理信息表示与检索,P208
  14. 基于信息依存语言模型的英汉被动结构对比研究,H314.3
  15. 基于词典和概率统计的中文分词算法研究,TP391.1
  16. 信息几何及其应用,O186.12
  17. 高维空间双特征Beltrami方程组,O175
  18. 散度—旋度场的正则性及应用,O174.3
  19. 互联网有害节目信息数据监测系统的设计与实现,TP393.06
  20. 元数据技术在科技资源数据库查询中的应用研究,TP311.13
  21. 基于内容的视频检索关键技术的研究与实现,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com