学位论文 > 优秀研究生学位论文题录展示
基于用户兴趣模型的个性化搜索引擎研究与分析
作 者: 周志辉
导 师: 刘建生;杜卫锋
学 校: 江西理工大学
专 业: 计算机应用技术
关键词: 信息检索 Web数据挖掘 搜索引擎 个性化搜索引擎
分类号: TP391.3
类 型: 硕士论文
年 份: 2010年
下 载: 96次
引 用: 0次
阅 读: 论文下载
内容摘要
随着Internet越来越迅速的发展,它给我们带来了海量信息,也给用户提供了许多有用的信息,但同时我们要在这么多的信息中查询我们所需要的信息也是十分困难的。搜索引擎成为人们最常用的信息检索工具,它涉及数据库、信息检索、人工只能、数据挖掘、Java、自然语言处理等多个领域的理论和技术。传统的搜索引擎对于任何用户检索出来结果都是相同的,没有考虑到用户的兴趣问题。因此搜索结果往往不能满足用户的需求,用户往往需要在海量的检索结果中筛选自己所需要的信息,这样耗费大量的时间。因此,个性化搜索引擎是当前一个重要的研究课题。本文针对目前搜索引擎的不足,充分研究了个性化搜索引擎的发展现状。本文的的主要工作如下:1)对搜索引擎、搜索引擎的工作流程、历史发展、现状和存在问题进行了简要综述.2)对个性化搜索引擎和相关技术和Web数据挖掘进行了研究.3)介绍了用户兴趣模型的描述,创建,以及更新。4)针对传统的个性化PageRank算法,利用基于关键词序列的用户事务聚类模式,给出了计算个性化PageRank算法中用户个性化信息特征的方法。5)给出了一个较为完整的个性化搜索引擎系统模型,并对基于关键词序列的用户模式识别方法,以及个性化PageRank方法的给出了结果的对比。本文的研究与探索为进一步研究搜索引擎的相关技术,提出了一个开发个性化搜索引擎的解决方案。
|
全文目录
摘要 4-5 Abstract 5-8 第一章 绪论 8-11 1.1 研究背景 8-9 1.2 研究意义 9 1.3 论文的研究内容及组织结构 9-11 1.3.1 研究内容 9-10 1.3.2 组织结构 10-11 第二章 搜索引擎和数据挖掘相关知识 11-25 2.1 搜索引擎 11-14 2.1.1 搜索引擎的概念 11 2.1.2 搜索引擎的工作原理 11-12 2.1.3 搜索引擎的分类 12-13 2.1.4 搜索引擎的发展现状 13 2.1.5 现阶段搜索引擎的不足 13-14 2.2 个性化搜索引擎 14-20 2.2.1 个性化搜索引擎的概念 14 2.2.2 个性化搜索引擎的工作原理 14-15 2.2.3 个性化搜索引擎的分类 15-20 2.3 数据挖掘技术 20-24 2.4 本章小结 24-25 第三章 用户个性化模式的获取和表达 25-35 3.1 可行性分析 25-26 3.2 方式的选择 26-31 3.2.1 数据准备 27-28 3.2.2 用户识别 28-29 3.2.3 事物模式识别 29-31 3.3 用户兴趣模型的创建 31-32 3.4 用户浏览行为分析 32-33 3.5 用户兴趣模型的更新 33-34 3.6 本章小结 34-35 第四章 基于关键词序列的个性化网页权重方法 35-39 4.1 方法概述 35-36 4.2 基于修改网页权重值的个性化PageRank 36-38 4.3 本章小结 38-39 第五章 实验分析与系统的实验 39-45 5.1 系统的开发方式 39 5.2 主要的数据结构 39-41 5.3 存储过程 41 5.4 系统的功能模块 41-42 5.5 结果分析 42-44 5.6 本章小结 44-45 参考文献 45-48 致谢 48-49 个人简历 在学期间发表的学术论文与研究成果 49
|
相似论文
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 面向海量邮件的检索系统研究与实现,TP393.098
- 网络搜索引擎的相关技术研究,G354
- 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
- 基于语义网络的智能搜索引擎研究,TP391.3
- 搜索引擎服务提供商版权侵权责任认定标准探讨,D923.41
- 基于Web搜索和网页结构分析的IT相关主题新闻抓取研究,TP393.092
- 基于WEB平台的家电类产品智能导购系统的研究,TP311.52
- 基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
- 分布式搜索引擎索引安全及缓存策略研究,TP333
- 基于WebHarvest的中文财经新闻搜索引擎的设计与实现,TP311.52
- 基于数据挖掘技术的求职招聘系统设计与实现,TP311.13
- 基于稀疏非负矩阵分解的图像检索,TP391.41
- 跨语言文本分类的研究,TP391.1
- 基于分类模型监测电子商务违禁信息的研究与实现,TP393.09
- 排序学习损失函数的研究,TP181
- 教育培训行业互联网营销问题的研究,F49
- 搜索引擎侵权行为研究,D923
- 基于Web数据挖掘的个性化搜索引擎研究,TP391.3
- 基于Agent元搜索引擎的个性化研究,TP391.3
- 基于点击的用户聚类的研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|