学位论文 > 优秀研究生学位论文题录展示

对等网络中基于关键字的搜索

作 者: 施聪
导 师: 俞勇
学 校: 上海交通大学
专 业: 计算机应用技术
关键词: 对等网络 文件共享 搜索
分类号: TP391.3
类 型: 硕士论文
年 份: 2008年
下 载: 118次
引 用: 1次
阅 读: 论文下载
 

内容摘要


对等网络以其大规模,自组织,以及健壮性等优特近年来受到学术界越来越多的关注。自第一代对等网络系统Napster开始,文件共享一直是对等网络的一个非常重要的应用。由于对等网络的大规模的特点,文件共享系统可以充分利用各个加入该系统的用户的资源来提高服务的质量。然而这一特定也同时给对等网络文件共享系统带来了很大的挑战。其大规模分布式的特性使得在对等网络文件共享系统中的文件搜索变得非常困难,同时给网络也带来了非常大的负担。因此,如何在对等网络中实现高效的搜索是一个非常重要的研究课题。本论文将系统研究在两类流行的对等网络系统中——非结构化对等网络和结构化对等网络——如果实现高效的基于关键字的搜索。针对于对等网络大规模分布式的特点,我们着力于从提高搜索准确率和降低网络负担两方面来研究这一课题。以前提出的搜索机制往往要么搜索效果不佳、要么网络负担比较重,而很少能同时兼顾两方面。我们提出的搜索机制能很好的平衡两方面的因素,实现高效的对等网络搜索。在非结构化对等网络中,本文提出了一种基于学习的查询消息路由协议来实现高效的搜索。由于它利用了路由过程中查询及查询应答消息所携带的信息来构建和维护查询路由表,极大地减轻了查询对于网络所带来的不必要的负担。同时我们充分利用了在现实对等网络中所观察到的查询消息存在大量重复这一现象,利用加强学习的思想来达到优化查询路由决策的目标。这一机制相对于以前所提出的机制而言,同时获得了满意的搜索结果和极低的额外网络负担。在结构化对等网络中,文件按照其关键字在不同的节点上建立索引。对于多关键字的搜索就需要将不同关键字所对应的文件列表在节点间进行交换来实现来找到同时具有这些关键字的文件。由于单个关键字所对应的文件数量非常大,这一过程中网络负担也很严重。通过分析我们发现多个集合的交集的大小是由这几个集合的特性决定的。因此,找到一种合适的多集合求交的顺序策略,就能极大的降低这一过程中的网络负担。本文提出了一种高效的调度策略极大的降低了网络负担。

全文目录


摘要  4-6
ABSTRACT  6-12
1 引言  12-16
2 相关研究工作  16-24
  2.1 对等网络应用的架构  16-20
    2.1.1 非结构化对等网络  17-18
    2.1.2 结构化对等网络  18-20
  2.2 对等网络中基于关键字的搜索  20-24
    2.2.1 非结构化对等网络中基于关键字的搜索  20-22
    2.2.2 结构化对等网络中基于关键字的搜索  22-24
3 非结构化对等网络中的搜索算法  24-50
  3.1 概述  24-25
  3.2 基于学习的查询消息路由算法  25-32
    3.2.1 查询消息的转发机制  26-29
    3.2.2 索引表的构建和维护  29-32
  3.3 算法的优化  32-35
    3.3.1 多关键字搜索  33-34
    3.3.2 文件分布的粗略描述  34-35
  3.4 算法的评估  35-48
    3.4.1 评估方法  35-37
    3.4.2 实验结果  37-48
  3.5 总结  48-50
4 结构化对等网络中的搜索算法  50-65
  4.1 概述  50-52
  4.2 问题的定义  52-53
  4.3 算法的概述  53-54
  4.4 评价值的估计  54-60
    4.4.1 LogLog 算法  54-55
    4.4.2 交集大小的估计  55-56
    4.4.3 精度分析  56-60
  4.5 搜索算法的特性  60-63
    4.5.1 可选的搜索方法  60
    4.5.2 算法的特性分析  60-63
  4.6 实验分析  63-65
5 总结和展望  65-67
参考文献  67-71
致谢  71-72
攻读学位期间发表的学术论文  72

相似论文

  1. 风光互补并网发电系统及最大功率点追踪,TM61
  2. 透析“人肉搜索”中的隐私权保护,D923
  3. 基于BP网络的元搜索引擎研究,TP391.3
  4. 搜索链接服务商著作权侵权问题研究,D923.41
  5. 爆炸搜索算法研究,TP301.6
  6. 一种对等网络流媒体直播算法的设计与仿真实现,TN919.8
  7. P2P点播系统存储管理研究与实现,TN948.64
  8. 高性能存储系统的关键技术研究,TP333
  9. 一种分布环境下加密文件系统的设计与实现,TP309.7
  10. 分布式文件系统中集中安全管理服务器设计与实现,TP316.4
  11. 基于移动代理的商品搜索技术研究,TP391.3
  12. 基于灰色理论的P2P网络行为分析与预测,TP393.02
  13. 红外热像仪自动调焦和图像采集技术的研究,TP391.41
  14. 毫米波频率步进雷达一维距离成像MFC编程实现,TN957.51
  15. 云计算环境下可证明数据持有技术研究,TN918.2
  16. 基于搜索算法的煤矿生产系统可靠性优化研究,TD82-9
  17. 网络言论侵权行为入罪问题研究,D924.3
  18. 搜索链接服务引发的信息网络传播权侵权问题研究,D923.41
  19. 基于用户体验的网站多面搜索导航研究,TP393.092
  20. Deep Web查询接口集成及搜索策略研究,TP393.09
  21. 认知风格和空间能力对网络搜索行为的影响,B842.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com