学位论文 > 优秀研究生学位论文题录展示

基于用户模型的个性化网络文献检索系统的研究与设计

作 者: 谭利文
导 师: 窦平安
学 校: 吉林大学
专 业: 情报学
关键词: 用户模型 个性化信息服务 搜索引擎 研究与设计 检索系统 网络信息 信息检索服务 相关度 个性化检索 信息过滤
分类号: G354
类 型: 硕士论文
年 份: 2004年
下 载: 480次
引 用: 3次
阅 读: 论文下载
 

内容摘要


本文提出了一种个性化的网络文献信息检索系统的设计研究,通过收集用户的基本信息和兴趣信息,建立面向用户兴趣的新型个性化网络信息服务系统。用户的兴趣模型可以说是系统个性化实现的基础,搜索引擎、系统与搜索引擎的接口以及向量模型的匹配算法是系统个性化实现的根本,本文还就Web页面的识别、聚类技术分别作了研究介绍。文中除了根据一定方法和原则建了一个用户模型之外,还就目前比较先进、智能的Agent、机器学习建模技术作了相关研究,最后本文还介绍了系统另外一个比较重要的功能——信息检索主动推送服务的实现。系统个性化网络文献信息检索服务的实现主要可以由以下五步进行:第一步,用户在系统用户界面的搜索框中输入自己的关键词或者词组信息,然后向系统提交。第二步,把第一步获取到的关键词通过系统的搜索引擎接口送到专门的搜索引擎,由它们执行实际的搜索行为。同时通过抽取算法获得结果文档特征项。第三步,把获得的每一结果项的文档向量,通过向量模型算法和用户模型向量计算出相关度,并以相关度排序的方式,对文档向量进行保存。第四步,结果显示。在用户界面,把符合用户模型的结果,按照用户设定的最大值和相关度由高到底的顺序进行显示。第五步,根据用户的反馈行为,进一步优化用户模型,调整相关项的权值和权值因子。为了本文和系统目标的实现,论文以七章的内容来展开讨论研究:第一章是绪论部分,从网络信息作为我们现在获取信息的主要途径入<WP=77>手,讨论我们目前获取网络信息的主要方式,以及在获取网络信息时面临的问题,引出论文研究的背景。并就目前个性化网络信息检索服务产生的定义、背景以及现状做了介绍。 个性化网络信息检索服务,最直接的概念就是以“用户为中心“的服务模式。既根据用户提出的明确要求,用户的兴趣模型或通过用户个性、习惯的分析在网络上检索,向用户提供其可能需要的信息和服务,也是培养个性,引导需求的服务。其根本就是尊重用户,研究用户的行为和习惯,为用户选择更为重要的资源,提供特色网络信息检索的服务。第二章是对个性化网络文献检索技术的研究。首先,本章介绍了个性化技术中所涉及到的一些个性化的概念、思想和个性化在本文研究中的特征。个性化就是使事物具有个性,或者使其个性凸现;个性化的思想在本文中的含义就是以系统用户为中心,提炼其兴趣与偏好,以此为基础把从网络中检索出来的信息被动或主动地呈现到用户面前;个性化在系统中的基本特征是用户需求至上、用户描述文件(user profile)为基础、以现有搜索引擎为工具、基于相关度的方法、自学习与信息主动推送;个性化对社会服务业、信息化的发展具有深远意义。然后,本章还对网络文献的概念、特点、分类、检索以及目前检索面临的一些问题作了介绍,这是研究个性化网络文献检索必须要了解的前提知识。第三章是论文的重点,在这里主要研究了个性化检索基于的基本理论和方法。这都是系统最终实现的支柱。由于系统的个性化检索最终的数据源还是搜索引擎中的数据库,因此我们就要了解搜索引擎的一些基本知识,搜索引擎是一个网络信息查找工具,它一般是由搜集器、检索器、管理器三个部分组成,各部分为信息搜索完成不同的功能,它的技术基础主要包括HTTP协议、Robot技术、信息检索技术这三部分;既然系统最终的提问要提交到搜索引擎,那这里就有一个系统与搜索引擎的接口的问<WP=78>题,本章以Google搜索引擎为代表,根据Google搜索引擎的搜索和结果网页界面的Html语言特征,给出了系统与Google接口实现原理的伪代码;用户兴趣模型也是系统个性化实现的前提,本章基于用户的基本信息和兴趣建立了一个简单、易行、实用的用户模型,并介绍了用户模型的体系结构和实现结构;向量空间模型是个性化信息的过滤算法,通过计算出文档特征向量和用户模型向量的相关度,对搜索引擎的搜索结果重新过滤、排序,实现个性化信息服务;本章最后还就Web页面的识别、特征提取以及文档特征向量的表示,简单的聚类技术作了介绍。第四章也是论文的重点,主要介绍了系统的一些主要模块的设计,包括用户界面、信息检索、信息过滤与反馈、用户模型更新这四大模块。用户界面是用户与系统进行交互的基础,用户信息的输入和输出都在这里进行,它在系统应用中的作用主要体现在信息导引、结果显示与反馈这两方面;系统的信息检索其实就是屏蔽掉了的搜索引擎的检索,本章介绍了系统信息检索模块中用户模型、文档特征向量的数据结构的表示,以及系统信息检索的基本步骤和简单原理图;信息过滤与反馈是个性化真正实现的部分,信息过滤不但要过滤掉相关度低的结果还要过滤掉错误的结果项,并以恰当的方式把结果显示给用户;当然这样得到的结果并不一定满足所有用户的要求,在系统的用户兴趣模型更新模块,主要根据用户的反馈对用户模型重新调整,使用户模型切实反应出用户的个性化需求。第五章介绍了Agent和机器学习这两种技术的一般性知识,以及它们在用户建模方面的应用,并对目前一些建模方法作了简单研究。用户建模一般可以通过这些方法来进行:服务器端挖掘、用户

全文目录


第一章 绪 论  6-10
第二章 个性化网络文献检索技术  10-22
  2.1 个性化技术  10-16
    2.1.1 个性化信息的概念  10-11
    2.1.2 个性化的核心思想  11
    2.1.3 个性化的基本特征  11-15
    2.1.4 个性化的意义  15-16
  2.2 网络文献及其检索  16-19
    2.2.1 网络文献的概念  16
    2.2.2 网络文献的特点  16-18
    2.2.3 网络文献的分类  18
    2.2.4 网络文献的检索  18-19
  2.3 个性化网络文献检索面临的问题  19-22
    2.3.1 文献搜索  19-20
    2.3.2 文献分类  20
    2.3.3 站点的信息组织标准化问题  20-22
第三章 个性化检索基于的基本方法与理论  22-40
  3.1 搜索引擎  22-24
  3.2 系统与搜索引擎的接口  24-29
  3.3 用户模型兴趣  29-35
  3.4 向量空间模型  35-37
  3.5 Web页面的识别  37-39
    3.5.1 Web页面的处理与特征提取  37-38
    3.5.2 文档特征向量的表示  38-39
  3.6 聚类技术  39-40
第四章 个性化网络文献检索系统主要模块的设计  40-49
  4.1 用户界面模块  40-41
  4.2 信息检索模块  41-45
  4.3 信息过滤与结果反馈模块  45-47
  4.4 用户模型更新模块  47-49
第五章 用户建模技术  49-59
  5.1 Agent 技术  49-53
    5.1.1 Agent 技术和信息基础智能化  49-50
    5.1.2 Agent介绍  50-52
    5.1.3 Agent技术在用户建模中的应用  52-53
  5.2 机器学习  53-56
  5.3 用户建模  56-59
第六章 系统信息主动推送服务  59-67
  6.1 网络信息检索主动推送服务  59-61
  6.2 系统信息检索主动推送平台  61-65
    6.2.1 主动推送服务的内容  61-62
    6.2.2 主动推送服务的主要功能部分  62-65
  6.3 用户反馈  65-67
第七章 结 论  67-70
参 考 文 献  70-84

相似论文

  1. 渤海上京城城门复原研究,TU-05
  2. 用于检索的人脸特征提取与匹配算法研究,TP391.41
  3. 个性化检索中相似用户群的获取与更新,TP391.3
  4. 大众标注及其在高校图书馆中的应用,G258.6
  5. 分面元数据在网站检索系统中的应用研究,G354.2
  6. 网络搜索引擎的相关技术研究,G354
  7. 中专英语作业设计的有效性研究,G633.41
  8. 基于语义网络的智能搜索引擎研究,TP391.3
  9. 基于信息生态的网络信息资源构建研究,G201
  10. 搜索引擎服务提供商版权侵权责任认定标准探讨,D923.41
  11. 基于Web搜索和网页结构分析的IT相关主题新闻抓取研究,TP393.092
  12. 在线招投标系统信息安全的设计与实现,TP393.08
  13. 移动AdHoc网网的入侵检检:基于时时有限状状自动机方法,TN929.5
  14. 基于信息交互的无线传感器网络改进LEACH协议研究,TN915.04
  15. 基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
  16. 分布式搜索引擎索引安全及缓存策略研究,TP333
  17. 基于WebHarvest的中文财经新闻搜索引擎的设计与实现,TP311.52
  18. 面向教育新闻的主题爬虫设计与实现,TP391.3
  19. SMBSDD:一种改进的非结构化P2P网络搜索机制,TP393.02
  20. 移动网络综合告警管理系统的设计与实现,TN929.5
  21. 构建和谐“虚拟社会”的哲学思考,D631.4

中图分类: > 文化、科学、教育、体育 > 科学、科学研究 > 情报学、情报工作 > 情报检索
© 2012 www.xueweilunwen.com