学位论文 > 优秀研究生学位论文题录展示

基于DHT的索引结构研究

作 者: 汤宇哲
导 师: 周水庚
学 校: 复旦大学
专 业: 计算机软件与理论
关键词: 分布式哈希表 查询处理 数据索引 负载平衡 分布式算法
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 72次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,随着DHT(分布式哈希表)的发明,各种大规模高容错的分布式系统在实际应用中变得十分普遍。基于DHT的各种应用需求也随之应运而生,例如一些基于DHT的数据库系统就具有复杂查询的需求。但是,由于DHT中的哈希方程破坏了数据放置的邻近性,在DHT系统中支持复杂查询变成一件十分困难的事情。在现有的方法中,一部分方法通过修改DHT内部结构来重新设计系统,而另外一部分则通过在DHT上层建立索引来支持复杂查询。后一种方法由于基于模块化思想而更具有实用性,因此我们采用这种方法。在本文中,我们研究了如下问题:如何利用DHT对外的通用接口来构建高效的分布式查询系统。我们提出了一套完整的方法(m)-LIGHT来进行DHT上的索引和查询处理。(m)-LIGHT包括一维索引LIGHT和多维索引m-LIGHT。首先,我们考察了一维的情况,并提出了索引方法LIGHT。LIGHT通过一种全新的命名机制将索引结构分布地放置到DHT上,由此提高了查询性能并降低了索引维护开销。就查询处理而言,LIGHT能实现性能的最优化,具体的包括范围查询,k-NN查询和Min/Max查询。同时LIGHT也减少了维护索引的带宽需求。我们进一步研究了多维数据的情况,并提出了m-LIGHT。相似的,m-LIGHT能实现查询处理和索引维护上的高效性,并且极大的减轻了在多维数据下常见的负载不均衡的情况。具体而言,我们扩展了原有一维的命名方程,将多维索引结构合理的分布到底层DHT系统中。同时,m-LIGHT采用一种数据分布相关的分裂方法来对索引进行分布式维护,并由此实现负载平衡的最优化。我们进行了广泛的真实实验来测量和评定(m)-LIGHT的性能。与当前其他基于DHT的索引方法相比,(m)-LIGHT节省了相当多的索引维护开销,实现了更加平衡的负载分布,并且在带宽消耗和查询延迟上都提高了查询处理的性能。

全文目录


摘要  5-6
Abstract  6-7
第一章 引言  7-10
  1.1 研究背景与意义  7-8
  1.2 研究内容与取得的成果  8-9
  1.3 本文结构  9-10
第二章 相关工作  10-14
  2.1 DHT覆盖网络  10
  2.2 P2P索引系统  10-13
    2.2.1 基于DHT的索引  10-12
    2.2.2 依赖覆盖网的索引  12-13
  2.3 P2P多维索引方法  13
  2.4 小结  13-14
第三章 一维P2P索引方法  14-37
  3.1 LIGHT的索引结构  14-18
    3.1.1 系统总览  14
    3.1.2 空间划分树  14-16
    3.1.3 本地树的存储  16-17
    3.1.4 命名方程  17-18
  3.2 LIGHT查找  18-20
  3.3 增量式索引维护  20-24
    3.3.1 数据插入和叶节点分裂  20-21
    3.3.2 数据删除与叶节点合并  21-23
    3.3.3 索引维护开销的分析  23-24
  3.4 复杂查询处理  24-28
    3.4.1 范围查询  24-27
    3.4.2 并行化的范围查询处理  27
    3.4.3 Min/Max查询  27-28
    3.4.4 k-NN查询  28
  3.5 实验评定  28-37
    3.5.1 实验设置  28-30
    3.5.2 索引的结构特征  30
    3.5.3 查找性能  30-31
    3.5.4 索引维护开销  31-34
    3.5.5 范围查询性能  34-36
    3.5.6 实验小结  36-37
第四章 多维P2P索引方法  37-51
  4.1 m-LIGHT索引结构  37-40
    4.1.1 空间划分kd树  37
    4.1.2 m维命名方程  37-40
  4.2 索引结构的维护  40-44
    4.2.1 增量式索引维护  40-41
    4.2.2 数据敏感的分裂策略  41-42
    4.2.3 存储负载的平衡最优性  42-43
    4.2.4 数据删除  43-44
  4.3 范围查询处理  44-46
    4.3.1 基本范围查询算法  44-45
    4.3.2 并行范围查询算法  45-46
  4.4 实验评定  46-51
    4.4.1 实验设置  46-47
    4.4.2 索引维护开销  47
    4.4.3 数据敏感分裂下的负载平衡  47-48
    4.4.4 多维范围查询性能  48-50
    4.4.5 实验小结  50-51
第五章 结束语  51-52
  5.1 未来工作  51
    5.1.1 查询负载平衡和数据副本  51
    5.1.2 数据缓存  51
  5.2 全文小结  51-52
参考文献  52-56
发表文章目录  56-57
致谢  57-58

相似论文

  1. 支持XML数据查询的F&B索引结构的研究,TP311.13
  2. 海量多数据库集成系统的查询处理研究,TP311.13
  3. 频繁图结构并行挖掘算法的研究与实现,TP311.13
  4. 遥感数据处理网格平台的设计与初步实现,TP79
  5. 概率XML文档中Holistic Twig查询处理算法的研究与实现,TP311.13
  6. Linux集群环境下作业调度算法的研究与实现,TP301.6
  7. 不确定数据及相关性表示性实时概率查询处理,TP311.13
  8. 无线传感器网络节点三维定位算法研究,TN929.5
  9. 基于网络存储的流媒体服务器系统,TN919.8
  10. 无线传感器网络路由算法研究,TP212.9
  11. 网络环境下的分布式存储系统的设计与实现,TP333
  12. 配电网单相接地故障隔离方法的研究,TM862
  13. 在线备份系统中存储服务器的研究与实现,TP333
  14. 网络实体及其关系信息的组织和搜索,TP391.3
  15. 基于数据挖掘的社区网站用户行为分析系统,TP393.092
  16. 基于Agent实时监控系统的研究与实践,TP277
  17. 基于JAVA的多数据库中间件的设计与实现,TP311.10
  18. 基于分布式的频繁闭合模式挖掘算法研究,TP311.13
  19. 一种适用于井下超声波通信的FSK调制解调技术研究,TN914
  20. 分布式声源定位与跟踪算法研究,TN912.3
  21. 面向位置服务的轨迹数据时空索引技术研究,P208

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com