学位论文 > 优秀研究生学位论文题录展示

海量数据的高维索引结构研究

作 者: 于静洋
导 师: 曹奎
学 校: 河南大学
专 业: 应用数学
关键词: 高维索引结构 特征提取 K-means聚类 VP-tree M-tree
分类号: TP391.3
类 型: 硕士论文
年 份: 2009年
下 载: 259次
引 用: 1次
阅 读: 论文下载
 

内容摘要


图像作为一种内容丰富、表现直观的媒体,在许多领域都得到了广泛应用,如数字图书馆、地理信息系统、生物信息学的DNA数据库和医学辅助诊断等。如何在大型图像数据库中快速处理基于内容的相似性检索变得越来越重要,高维索引技术是基于内容的相似性检索领域研究的一个基本问题,也是一个热点问题,因此研究海量数据的高维索引结构具有重要的理论和实际意义。然而,由于受到“维度灾难”的影响,随着数据维数的增长,传统的索引结构性能急剧下降。针对上述问题,本文以大规模图像库的海量高维数据为背景,围绕图像特征的高维特性,通过实验研究分析了图像高维特征数据的距离分布特点,在此基础上,研究并设计了新的高维数据索引结构KVP-tree。论文的主要工作如下:第一,本文通过实验首先提取分类图像库和混合图像库的不同类型不同维数的特征向量并对其进行归一化,然后计算图像库中任意两幅图像之间的距离,最后分析得出高维数据的距离分布特点:高维空间中的距离分布具有较大的均值和较小的方差,其距离分布是“集中的”。进而分析得出如下结论:高维空间的索引结构采用“平衡树”不一定是最好选择。第二,本文结合K-means聚类算法和M-tree的结点结构对VP-tree进行改进,给出了一种新的高维索引结构KVP-tree,介绍了其设计思想、结点结构、建树过程和查询方法,最后利用测试数据,对VP-tree和KVP-tree的性能进行深入的实验分析。通过实验对KVP-tree和VP-tree的查询性能进行了详细比较,KVP-tree增加了结点的输出能力,减少了距离计算次数,提高了查询效率。

全文目录


相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  4. Q学习在基于内容图像检索技术中的应用,TP391.41
  5. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  6. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  7. 空间交会接近视觉测量方法研究,TP391.41
  8. 图像实时采集、存储与处理方法研究,TP391.41
  9. 唇读中的特征提取、选择与融合,TP391.41
  10. 多币种纸币处理技术的研究与实现,TP391.41
  11. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  12. 基于图像的路面破损识别,TP391.41
  13. 移动机器人视觉检测和跟踪研究,TP242.62
  14. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  15. 基于随机森林的植物抗性基因识别方法研究,Q943
  16. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  17. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  18. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  19. 红外图像目标识别及跟踪技术研究,TP391.41
  20. 水下目标特征的压缩与融合技术研究,TN911.7
  21. 基于遗传算法和粗糙集的聚类算法研究,TP18

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com