学位论文 > 优秀研究生学位论文题录展示
基于隐式协同的社会化搜索排序研究
作 者: 宁鹏飞
导 师: 董宇欣
学 校: 哈尔滨工程大学
专 业: 计算机软件与理论
关键词: 社会化搜索 SimRank 日志挖掘 协同搜索 信任度
分类号: TP391.3
类 型: 硕士论文
年 份: 2013年
下 载: 16次
引 用: 0次
阅 读: 论文下载
内容摘要
互联网经过几十年的发展,已经极大程度上融入到了人们的现实生活当中,随着产业与需求的发展,互联网被划分为几大入口,包括搜索引擎、浏览器、即时通信以及当下流行的社会网络等等。搜索引擎解决了人们在互联网海量信息当中快速便捷地获取有效内容的问题,社会网络在虚拟网络世界建立了类现实的人际关系网络,拉近了人与人之间的距离。搜索引擎与社会网络作为两大互联网入口,不能孤立发展。传统搜索引擎对任何用户的相同搜索请求都会返回相同搜索结果,在进行个性化服务转型过程,搜索引擎往往只是根据用户兴趣等因素对用户单独的个性化服务,用户彼此的个性化信息不能够被相互借鉴。社会网络为用户相互借鉴个性化信息提供了良好的基础平台,用户在进行搜索时不再是孤军奋战,而协同好友共同完成一次搜索任务。搜索引擎与社会网络的融合,催生了社会化搜索的相关研究。然而,社会化搜索的研究还处于一个起步阶段,研究都对于社会化搜索如何将搜索引擎与社会网络结合起来都有不同的认识。本文从社会网络可为搜索引擎提供协同式服务的角度出发,基于隐式协同对社会化搜索排序进行深入研究。本文的主要研究工作包括以下几个方面:1.采用社会网络分析法对搜索引擎进行日志分析,以不确定图的方式逻辑表示搜索引擎的日志中查询词和网页的链接关系,通过基于不确定图的SimRank算法,计算查询词与网页的相似度,最终以相似度和查询词的加权方式建立网页描述库。2.从分析用户搜索经验入手,计算社会网络中用户的信任度。在建立用户间信任度量的基础上提出隐式协同模型。3.结合前两方面工作,综合提出社会化搜索排序算法。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-15 1.1 引言 10 1.2 研究背景与意义 10-12 1.3 国内外研究现状 12 1.4 论文主要研究内容及组织结构安排 12-15 第2章 新一代搜索引擎相关技术 15-24 2.1 搜索引擎发展变迁 15-16 2.2 协同式搜索 16-19 2.2.1 协同式搜索的定义及分类 16-18 2.2.2 协同式搜索模型 18-19 2.3 社会化搜索 19-22 2.3.1 社会化搜索的定义及概述 19 2.3.2 社会化搜索的理论基础 19-22 2.4 本章小结 22-24 第3章 面向搜索引擎日志的社会网络分析 24-40 3.1 搜索引擎日志数据挖掘 24-28 3.1.1 日志数据的逻辑表示 25-27 3.1.2 构建网页描述库 27-28 3.2 提取网页描述信息的策略 28-36 3.2.1 理论依据 28-29 3.2.2 SimRank 算法简介 29-30 3.2.3 面向不确定图的 SimRank 算法 30-36 3.3 实验与分析 36-39 3.3.1 数据获取及预处理 36-37 3.3.2 实验设计与评价 37-39 3.4 本章小结 39-40 第4章 基于隐式协同的用户模型 40-50 4.1 隐式协同模型 40-43 4.1.1 协同对象的选择 41-42 4.1.2 协同任务的组织与分配 42-43 4.2 用户搜索经验 43-46 4.2.1 用户搜索经验的获取 44 4.2.2 用户搜索经验的表达 44-45 4.2.3 用户搜索经验的利用 45-46 4.3 社会网络用户信任度 46-49 4.4 本章小结 49-50 第5章 社会化搜索排序研究 50-56 5.1 社会化搜索模型 50-52 5.2 社会化搜索排序算法 52 5.3 实验与分析 52-55 5.3.1 评测标准与数据集 52-54 5.3.2 效果分析 54-55 5.4 本章小结 55-56 结论 56-57 参考文献 57-61 致谢 61
|
相似论文
- 基于兴趣度的Web日志用户访问序列模式挖掘,TP311.13
- 利他行为的研究,C912.3
- 政府公众信任度模型研究,D630
- 无线传感器网络定位及目标跟踪的研究,TN929.5
- 基于社会化标注的网页检索研究,TP393.092
- 基于兴趣分类的用户行为分析系统的研究,TP393.092
- P2P模糊信任模型中的隶属度预测和权重分配研究,TP393.08
- 网格环境下基于滑动窗口的信任模型研究,TP393.08
- 基于Web日志挖掘的个性化推荐系统研究,TP311.13
- 基于P2P网络SNTrust信任模型的研究与实现,TP393.08
- 基于WEB日志挖掘的个性化服务技术的研究,TP393.092
- WEB日志数据挖掘的研究和实现,TP311.13
- Web日志挖掘技术在个性化信息推荐中的应用,TP311.13
- 基于关联规则及序列模式的Web日志挖掘系统,TP311.13
- 基于Web日志的数据挖掘研究与实现,TP311.13
- 异构无线融合网络接入选择算法研究,TN92
- Web2.0的社会性对网络用户信息行为的影响研究,G350
- 政府网站日志挖掘的研究与实践,TP393.092
- 关联规则挖掘算法在web日志挖掘中的应用研究,TP311.13
- 基于WEB日志挖掘的频繁模式挖掘算法研究,TP311.13
- 基于Web日志挖掘的聚类算法研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|