学位论文 > 优秀研究生学位论文题录展示
基于信任网络的查询扩展技术研究
作 者: 董静
导 师: 印桂生
学 校: 哈尔滨工程大学
专 业: 计算机软件与理论
关键词: 查询扩展 信息检索 信任网络 信任计算
分类号: TP391.3
类 型: 硕士论文
年 份: 2013年
下 载: 5次
引 用: 0次
阅 读: 论文下载
内容摘要
随着网络上信息量的飞速增加,怎样从巨大的信息宝库中有效地查找到符合用户需求的信息逐渐成为人们关注的焦点。在信息检索领域中,查询扩展是解决词语不匹配问题并提高检索效率的重要方法之一,它将与当前查询相关度较高的词项加入到初始查询中,以弥补因用户查询过于简短和词语歧义性对查询效果产生的影响。目前多数的查询扩展方法没有对不同用户进行区分,个性化程度较差,无法满足不同用户的查询需求,影响用户满意度。传统的基于用户日志的方法根据对大量用户的历史查询词进行统计,计算出与查询相关度较高的词语加入原始查询完成查询扩展。该方法针对大量用户进行统计性计算,无法对不同用户给出有针对性的查询结果,缺乏个性化处理,而且该方法对日志信息的挖掘不够充分,对查询效果的改善不十分明显。针对以上问题,本文提出一种基于信任网络的查询扩展模型,旨在通过建立用户信任网络找出本次查询的可信任用户作为扩展词来源用户,同时通过深入挖掘用户查询日志信息,有效地提取扩展词,从而改善查询效果,提高用户对查询结果的认可度。首先,本文提出一种基于信任网络的查询扩展模型,充分利用用户社会关系,丰富扩展词来源,以有效的提高查询扩展的准确度从而改善查询结果,提高用户满意度;其次,提出一种结合社会性和相似性信任度的混合用户信任度计算方法,使个体间的信任关系以主题相关性为基础,准确的选择偏好与当前查询相符的可信用户作为扩展词项的来源用户;然后,通过深入挖掘日志中的初始排名和点击情况并结合用户信任度,给出一种基于用户日志和信任度的查询扩展方法;最后,设计多组实验验证作者提出的算法及模型整体的有效性。实验证明,本文提出的查询扩展模型可以有效的提高查询准确度,并提高用户对查询结果的满意程度。
|
全文目录
摘要 5-6 Abstract 6-9 第1章 绪论 9-16 1.1 课题背景及意义 9-10 1.2 国内外研究现状 10-14 1.2.1 基于全局分析的查询扩展方法 10-11 1.2.2 基于局部分析的查询扩展方法 11-12 1.2.3 基于局部上下文分析的查询扩展方法 12 1.2.4 基于语义词典的查询扩展方法 12-13 1.2.5 基于用户日志的查询扩展方法 13-14 1.3 本文研究内容 14-15 1.4 本文组织结构 15-16 第2章 相关技术介绍 16-27 2.1 基于局部上下文分析的查询扩展方法 16-19 2.1.1 前提假设 16-17 2.1.2 概念的选取标准 17-18 2.1.3 扩展词的权重计算 18-19 2.2 信任计算 19-22 2.2.1 信任的性质 19-20 2.2.2 信任的表示 20-21 2.2.3 信任的计算方法 21-22 2.3 用户查询的语义相似度计算 22-26 2.3.1 《知网》概要 23 2.3.2 《知网》的结构 23-24 2.3.3 基于《知网》的查询相似度计算 24-26 2.4 本章小结 26-27 第3章 基于信任网络的查询扩展模型 27-41 3.1 模型框架设计 27-29 3.2 混合的用户信任度计算方法 29-33 3.2.1 社会性信任度计算 30-32 3.2.2 相似性信任度计算 32-33 3.3 基于用户日志和信任度的查询扩展方法 33-39 3.3.1 用户日志处理 35-36 3.3.2 扩展词集生成 36-39 3.4 本章小结 39-41 第4章 实验结果及分析 41-52 4.1 混合的用户信任度计算方法 41-45 4.1.1 数据采集 41-43 4.1.2 评价标准 43 4.1.3 实验方法及结果分析 43-45 4.2 基于用户日志和信任度的查询扩展方法 45-51 4.2.1 数据集及评价标准 45-46 4.2.2 实验总结及分析 46-51 4.3 本章小结 51-52 结论 52-54 参考文献 54-58 攻读硕士学位期间发表的论文和取得的科研成果 58-59 致谢 59
|
相似论文
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 基于Web的未登录词翻译技术研究,TP391.2
- 基于社会网络分析的藏文web链接结构研究,TP393.09
- 英汉可比较语料库的构建与应用研究,TP391.1
- 基于Struts2框架的安全教育管理信息系统研究,TP311.52
- 基于分布式的垂直搜索引擎的研究与实现,TP391.3
- 基于稀疏非负矩阵分解的图像检索,TP391.41
- 跨语言文本分类的研究,TP391.1
- 基于随机游走模型的个性化信息推荐,TP391.3
- 广告搜索中的查询处理算法,TP391.3
- 综合档案馆与公共图书馆信息检索比较研究,G252.7
- 基于概率的潜在语义分析模型在搜索引擎商业文本分类系统中的应用研究,TP391.1
- 基于Web的医学文献数据库的设计与实现,TP311.13
- 面向地名本体服务的空间信息检索研究,P208
- 军事网格中信任管理研究,TP393.08
- 基于对等网络的搜索引擎关键技术研究,TP391.3
- 汉英跨语言网址搜索引擎的设计与实现,TP391.3
- 基于Agent的自适应信息检索系统技术研究,TP391.3
- 基于信息匹对及二维检索模式的三农信息化服务系统,TP311.52
- 信任计算在大用户直购电交易中的研究与应用,F426.61
- 基于技术接受模型的信息检索可视化研究,G252.7
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|