学位论文 > 优秀研究生学位论文题录展示
基于用户模型的中文个性化检索系统研究
作 者: 宋兴华
导 师: 刘桂霞
学 校: 吉林大学
专 业: 软件工程
关键词: 数字图书馆 个性化信息检索 用户模型 Web数据挖掘
分类号: G354
类 型: 硕士论文
年 份: 2011年
下 载: 108次
引 用: 0次
阅 读: 论文下载
内容摘要
随着信息社会的高速发展,人们脱离了信息闭塞的年代,进入一个信息高速传输的社会。这种高效的信息传输是由网络诞生而来。网络使世界变小,人们可以通过网络瞬时获取自己所需要的信息。过去人们获取信息的一个重要途径—图书馆,面临着被取代的危险,人们需要一个高效便捷的数字图书馆。而数字图书馆的发展,主要集中于数字信息的收集和整理,从使用者的角度并没有太多的改善,使用者在检索资源时需要耗费大量的时间。事实上,每个用户在某一时间段只对某一方面的信息感兴趣,所以一般情况下,用户很难检索到自己感兴趣的信息。所以,从使用者的角度出发,对资源检索的模式进行改善,对不同使用者的不同检索需求提供相应的服务,这样才能使数字图书馆能够获得更加良好的发展。个性化数字资源检索围绕使用者进行开发,使用者的需求目的和需求特征成为个性化检索的关键,主要分析使用者的搜索兴趣与爱好。在这种背景下,本论文在已存在的个性化信息检索系统的基础上,采用了用户建模技术、web数据挖掘技术和协同过滤技术,针对数字图书馆中文文本信息资源的特点和复杂性,组建了一个数字图书馆个性化中文文本信息检索系统,使用户在进行检索时能够用最少的操作就可以获得最符合自己需求的相关信息。本文共分五个部分。第一部分主要介绍数字图书馆个性化信息检索的研究现状和存在的不足,提出了该问题的相应的解决方案。同时,对与该检索系统开发所需要的一系列背景知识进行了研究和分析。第二部分分析了个性化检索系统的特点,围绕这些特点提出了该检索系统能够完成的目标。第三部分和第四部分是本文的重点。第三部分依据前一部分的分析,建立了系统的核心工作模型,逐一解释了相应功能模块的工作原理。在文档特征表示中,系统利用中文文本信息处理技术对文档进行分词处理,将每篇文档用词条表示成特征向量,用数学计算的模式来表示语意转换。该系统从三方面入手,完成用户建模对用户需求信息的获取:首先,由用户自主为检索提供所需要的检索信息;其次,由检索系统来完成对用户的需求行为分析,从用户提供的关键词中提炼其检索需求;最后,检索系统通过跟踪用户的查询检索过程,分析得出用户的检索习惯和习惯的改变情况。第四部分是检索系统的实现部分,检索系统通过用户模型扩展用户的查询,依据用户习惯向用户提供与用户平时需求相关的信息,屏蔽与用户查询无关的信息,从而提高查询的效率。这样兴趣爱好不同的用户,输入相同检索词,就能得到不同的检索结果。第五部分对当前工作做出总结,提出了进一步的改进意见。
|
全文目录
摘要 4-6 Abstract 6-10 第1章 绪论 10-17 1.1 研究背景 10-11 1.1.1 数字图书馆的概念与发展 10 1.1.2 背景 10-11 1.2 国内外个性化检索的研究现状 11-12 1.2.1 相关领域个性化信息检索研究现状 11-12 1.3 研究开发个性化信息检索的意义 12-13 1.4 个性化信息检索的相关理论和技术 13-16 1.4.1 协同过滤技术 13 1.4.2 个性化定制技术 13 1.4.3 Web 数据挖掘技术 13-14 1.4.4 用户建模技术 14-16 1.5 本论文的研究工作 16-17 第2章 研究对象的特点及系统需求分析 17-20 2.1 数字图书馆信息服务的特点 17-18 2.2 中文信息处理的特殊性 18 2.3 用户检索习惯的特征研究 18-19 2.4 数字图书馆个性化中文文本信息检索系统的需求分析 19-20 2.4.1 数字图书馆个性化中文文本信息系统的功能 19-20 第3章 数字图书馆个性化信息检索系统的结构 20-42 3.1 系统描述 20-21 3.2 建立文档模型(文档特征表示) 21-26 3.2.1 文档特征表示的意义 21-22 3.2.2 文档的预处理方法 22-24 3.2.3 文档特征提取和表示 24-26 3.3 个性化数据预处理 26-29 3.4 用户建模 29-37 3.4.1 接受用户直接训练(用户主动维护) 30-33 3.4.2 文本分析 33-35 3.4.3 检索日志分析 35-37 3.5 个性化信息检索模块 37-42 3.5.1 检索日志管理 37-38 3.5.2 个性化检索 38-42 第4章 个性化检索系统的实现 42-51 4.1 个性化检索系统简介 42 4.2 系统界面 42-46 4.3 个性化信息检索功能的实现 46-51 第5章 总结与展望 51-52 5.1 总结 51 5.2 展望 51-52 参考文献 52-54 作者简介及在学期间所取得的科研成果 54-55 致谢 55
|
相似论文
- 数字图书馆信息服务视域下的著作权问题研究,D923.41
- 基于云计算的数字图书馆服务模式研究,G250.76
- 基于Web挖掘技术研究及其在数字图书馆中的应用,G250.76
- 基于WEB平台的家电类产品智能导购系统的研究,TP311.52
- 数字图书馆的著作权问题研究,G250.76
- 基于数据挖掘技术的求职招聘系统设计与实现,TP311.13
- 基于GPU的图书推荐系统研究与实现,TP391.3
- 基于Web数据挖掘的个性化搜索引擎研究,TP391.3
- 基于点击的用户聚类的研究,TP311.13
- 数字图书馆对传统版权的挑战及应对,D923.41
- 数字图书馆著作权合理使用问题研究,D923.41
- 基于云计算的数字图书馆建设研究,G250.76
- 数字资源长期保存与长效利用策略的国际比较研究,G250.73
- 电子书对图书馆的影响与挑战研究,G255.75
- 数字图书馆版权问题研究,D923.41
- 数字图书馆数据库知识产权问题及保护研究,D913
- 泛在信息环境下图书馆信息资源组织研究,G250.73
- 数字图书馆开发中信息资源的发现与获取技术及实现条件研究,G250.76
- 基于WEB元数据抽取的ETL资源整合模型研究与实现,G250.73
- 宁波市数字图书馆若干关键技术的研究与应用,G250.76
- 信息可视化在数字图书馆中的应用研究,G250.76
中图分类: > 文化、科学、教育、体育 > 科学、科学研究 > 情报学、情报工作 > 情报检索
© 2012 www.xueweilunwen.com
|