学位论文 > 优秀研究生学位论文题录展示
数据挖掘技术在个性化信息检索系统中的应用研究
作 者: 陈小华
导 师: 赵捧未
学 校: 西安电子科技大学
专 业: 情报学
关键词: 数据挖掘 个性化信息检索 搜索引擎 聚类挖掘 分类挖掘 关联规则
分类号: G354
类 型: 硕士论文
年 份: 2006年
下 载: 420次
引 用: 1次
阅 读: 论文下载
内容摘要
随着网络应用的普及,网上信息量以惊人的速度增长,并且更新频繁。人们面对的问题不再是缺乏有用信息,而是如何找到自己所需要的信息。虽然传统信息检索技术在一定程度上满足了人们的需要,但却存在着低查准率和低查全率的问题。多数商业搜索引擎提供的信息检索服务,由于侧重通用性而不能满足不同背景、不同目的用户的查询请求。针对这种现状,作者研究了基于数据挖掘的个性化信息检索系统。论文首先对搜索引擎系统的研究现状和发展趋势进行论述,探讨了将数据挖掘技术应用于个性化信息检索系统的可行性,在此基础上提出了一个基于数据挖掘的个性化信息检索系统的总体框架模型。接着对该系统的主要功能进行较深入的描述,对该系统的的关键技术进行较深入的研究。最后给出了一种基于Apriori的类别关联规则的挖掘算法。仿真结果表明基于Apriori的类别关联规则的挖掘算法能够挖掘出用户的个性化信息,同时表明用户个性化信息的质量好坏与支持度值的大小密切相关。
|
全文目录
摘要 3-4 Abstract 4-7 第一章 绪论 7-15 1.1 选题研究背景 7-8 1.2 论文选题的国内外研究现状 8-11 1.3 选题研究的意义 11-12 1.4 本文的主要工作及论文的结构 12-15 第二章 搜索引擎系统概述 15-29 2.1 搜索引擎的定义 15 2.2 搜索引擎的历史 15-16 2.3 搜索引擎的评价标准 16-20 2.4 国内外搜索引擎的比较研究 20-24 2.4.1 国外搜索引擎的比较研究 20-22 2.4.2 国内搜索引擎的比较研究 22-24 2.5 现有搜索引擎的缺陷 24-25 2.6 搜索引擎的发展趋势 25-29 第三章 PIRSBDM 系统 29-41 3.1 PIRSBDM 系统设计思想 29-31 3.2 PIRSBDM 系统体系结构 31-33 3.3 PIRSBDM 系统功能描述 33-41 3.3.1 用户 33 3.3.2 最优检索式选择最优引擎模块 33-34 3.3.3 信息过滤模块(分类挖掘) 34-35 3.3.4 聚类挖掘模块 35-36 3.3.5 关联规则挖掘模块 36 3.3.6 用户个性化信息库 36-38 3.3.7 搜索引擎信息库 38-41 第四章 PIRSBDM 系统关键技术研究 41-55 4.1 关联规则挖掘 41-47 4.1.1 关联规则挖掘与“个性化”的关系 41 4.1.2 关联规则的基本概念和问题描述 41-42 4.1.3 关联规则评价 42-44 4.1.4 关联规则挖掘的步骤 44-45 4.1.5 关联规则挖掘的Apriori 算法 45-47 4.2 基于关键词向量的文档分类挖掘 47-50 4.2.1 Web 文档表示 47-48 4.2.2 文档相识度的计算 48-49 4.2.3 Web 文档分类 49-50 4.3 基于SOM 的Web 文档层次聚类方法 50-55 4.3.1 SOM 神经网络模型 50-52 4.3.2 Web 文档的聚类 52-55 第五章 PIRSBDM 系统中类别关联规则挖掘算法仿真 55-65 5.1 类别关联规则的基本概念 55-56 5.2 类别关联规则的挖掘过程 56-57 5.3 实例仿真 57-65 第六章 总结展望 65-67 致谢 67-69 参考文献 69-73 在读期间发表论文 73
|
相似论文
- 基于数据挖掘技术的保健品营销研究,F426.72
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于语义网络的智能搜索引擎研究,TP391.3
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 数据挖掘在学校管理和学生培养中的应用,TP311.13
- 搜索引擎服务提供商版权侵权责任认定标准探讨,D923.41
- 基于关联规则的结构化浏览技术及其应用,TP391.41
- 基于Web搜索和网页结构分析的IT相关主题新闻抓取研究,TP393.092
- 数据挖掘技术在独立学院教学评估中的应用研究,TP311.13
- 基于WEB平台的家电类产品智能导购系统的研究,TP311.52
- 通信行为指纹研究,TP311.13
- 动态关联规则的研究,TP311.13
- 高速网络环境下的入侵检测系统的研究,TP393.08
- GSM-R网络干扰分析和优化策略研究,TN929.532
- 基于数据挖掘技术的客户消费行为分析系统的开发与应用,TP311.13
- 基于关联规则的地铁基坑工程施工风险监测研究,U231.3
- 基于聚类分析和关联规则的痹证医案处方用药规律研究,R255.6
- 再生障碍性贫血中医证候分型文献的数据挖掘研究,R259
- 论搜索引擎竞价排名的法律规制,D923.43
中图分类: > 文化、科学、教育、体育 > 科学、科学研究 > 情报学、情报工作 > 情报检索
© 2012 www.xueweilunwen.com
|