学位论文 > 优秀研究生学位论文题录展示

基于P2P的分布式搜索引擎体系研究

作 者: 孙方
导 师: 陈晓云
学 校: 兰州大学
专 业: 计算机软件与理论
关键词: 局部遍历型搜索技术 P2P Chord SE-Chord算法
分类号: TP391.3
类 型: 硕士论文
年 份: 2007年
下 载: 320次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网的飞速发展,人们享受着丰富的网络资源,但能够满足用户个性化需求的网络服务非常匮乏。于是,产生了庞大的数字化网络信息与有限的获取所需信息能力的尖锐矛盾,并且随着网络及其资源的急速膨胀而日益突出。搜索引擎在一定程度上解决了这个矛盾,但仍存在一些亟待解决的问题,诸如如何实现基于内容的视频、音频等多媒体信息的搜索,如何提高海量数据上的检索更新效率,如何有效存储海量数据。解决上述问题已成为下一代搜索引擎技术的研究方向。目前流行的对等网络具有分布式、可量测性、负载平衡的优点,为解决这些问题提供了可能性。本文在深入研究P2P技术和搜索引擎技术的基础上,大胆地结合局部遍历型搜索技术与P2P Chord协议,提出了一个基于P2P的分布式搜索引擎系统方案(P2P-based Distributed Search Engine,PPDSE)。该系统方案可有效地减少相似度查询的计算复杂性,提高查询效率;并且在海量数据存储与查询操作并发方面占有优势。该系统方案具有技术上的先进性和操作上的可行性。PPDSE系统方案包含两个模块,PPDSE Agent和PPDSE Pocket。PPDSE Agent为用户提供注册服务,是PPDSE系统的智能代理服务中心;PPDSE Pocket是PPDSE系统的核心部分,设计为三层框架结构,用户应用层、控制层、数据层。其中,用户应用层提供用户查询、上传数据资料等功能;控制层使用局部遍历型搜索技术对信息进行聚类,建立信息树,将多维空间上的相似度度量问题转化成一维度量空间上的间隔问题;数据层提供了快速的资源定位机制、高效的结点路由机制和并行处理机制,提出了将局部遍历搜索应用于Chord协议上的SE-Chord算法。

全文目录


摘要  4-5
Abstract  5-6
目录  6-8
第一章 前言  8-10
  1.1 研究工作背景  8
  1.2 本文研究的内容和创新之处  8-9
  1.3 本文的组织结构  9-10
第二章 局部遍历型搜索技术  10-15
  2.1 文本的表示  10-12
    2.1.1 基于汉语的文本特征提取  10
    2.1.2 切词  10-11
    2.1.3 特征的选取  11-12
  2.2 文本特征缩减  12
  2.3 文本聚类分析介绍  12-15
    2.3.1 中文文本聚类的一般过程  12
    2.3.2 相似度度量  12-15
第三章 对等网络  15-25
  3.1 完全分布式结构化拓扑  15-16
  3.2 DHT算法  16
  3.3 Chord算法  16-25
    3.3.1 思想  16-17
    3.3.2 特点  17
    3.3.3 哈希算法  17-19
    3.3.4 键值定位  19-21
    3.3.5 结点动态性  21-25
第四章 PPDSE系统结构的构建  25-29
  4.1 概述  25-26
  4.2 PPDSE系统方案网络图  26-29
    4.2.1 PPDSE Agent  26-27
    4.2.2 PPDSE Pocket  27-29
第五章 PPDSE Agent设计  29-36
  5.1 概述  29
  5.2 注册信息  29-30
  5.3 初始化配置信息  30-36
    5.3.1 支点信息  30-34
    5.3.2 转换函授h  34-35
    5.3.3 已存在活动结点信息  35-36
第六章 PPDSE Pocket设计  36-46
  6.1 概述  36
  6.2 用户应用层  36
  6.3 控制层  36-40
    6.3.1 数据对象向量化  37
    6.3.2 VS2DM算法  37-39
    6.3.3 SE-Chord算法  39-40
  6.4 数据层  40-46
    6.4.1 结点加入操作  41-42
    6.4.2 发布数据信息  42
    6.4.3 数据信息查询  42-46
第七章 总结与展望  46-48
  7.1 创新点  46-47
    7.1.1 PPDSE系统方案  46
    7.1.2 SE-Chord算法  46-47
  7.2 下一步研究工作的展望  47-48
参考文献  48-50
致谢  50

相似论文

  1. 基于NS2的PeerCast模拟平台设计与实现,TP311.52
  2. 面向Gnutella和eMule网络拓扑测量和安全性分析,TP393.08
  3. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  4. 音像广播远程教育系统中直播服务器的设计与实现,TP311.52
  5. 基于P2P流媒体系统的设计与实现,TN919.8
  6. 基于物理拓扑感知的Chord算法研究,TP393.02
  7. 基于人工免疫的病毒检测技术研究,TP393.08
  8. 基于自组织网络的分布式广域后备保护研究,TM774
  9. 泛在环境下虚拟终端系统的组织机制研究与实现,TN915.02
  10. 基于P4P的流媒体点播系统研究与实现,TN948.64
  11. 基于P2P的空间矢量数据快速索引机制的研究,TP391.3
  12. 基于Winsock的C/S模式即时通信系统的设计及实现,TN914
  13. P2P网络信任模型及其相关技术的研究,TP393.08
  14. P2P流媒体特征提取技术研究与实现,TN919.8
  15. 大流量环境下实时P2P流媒体行为识别系统设计与实现,TN919.8
  16. 一个基于UDP协议的P2P即时通讯软件的设计与实现,TP393.02
  17. 一种IPV4/IPV6混合网络下P2P直播系统资源共享方法,TP393.02
  18. 基于P2P架构下的移动“全球眼”系统实现及性能分析,TN929.5
  19. 基于CDN和P2P技术的混合流媒体内容分发机制研究,TN919.8
  20. Pre~2VOD:一种VCR操作支持的VOD/P2P系统,TN948.64
  21. 一种无主控制的云存储架构的研究,TP333

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com