学位论文 > 优秀研究生学位论文题录展示
面向农产品信息的主题搜索引擎与信息推荐
作 者: 陈冰泉
导 师: 张平健;毛海峰
学 校: 华南理工大学
专 业: 软件工程
关键词: 主题搜索 关联规则 协同过滤 可定制搜索 Weighted Slope One
分类号: TP391.3
类 型: 硕士论文
年 份: 2010年
下 载: 93次
引 用: 0次
阅 读: 论文下载
内容摘要
随着Internet的不断发展,人们习惯将数据存放在Web上,也习惯从Web去浏览、查找他们所需要的信息。近10年Web信息每天以指数级的速度爆炸性地增长,且不断更新变化,使我们陷入了"Rich Data, Poor Information"的尴尬局面。我们面临一个很关键的问题,如何从浩瀚的Web海洋里面找到我们所需要的、对我们有用的信息。通用搜索引擎的出现解决了这个问题,它给用户提供了一个到达互联网的接口。但这个接口对任何用户都是一样的,无法满足用户对多样化信息的多样化要求。当用户需要深入互联网,获得分类细致即时更新的信息时,通用搜索显得力不从心,主题搜索随之诞生。本文致力于设计并实现一个面向农产品信息的主题搜索系统,并在该系统的基础上实现用户推荐。文中首先介绍了目前的搜索行业背景、垂直搜索在国内外的发展现状和趋势;接下来以搜索引擎原理、数据挖掘理论基础展开研究;分析并研究垂直搜索核心问题:如何解析与主题相关的Web信息并反馈给用户;在此基础上实现搜索的可定制;最后在得到领域相关信息的基础上,又考虑并实现如何能更进一步地方便用户,为用户作一些有价值的推荐信息。在为用户推荐信息环节,文中实现了两种算法,一种是在用户推荐领域久负盛名的关联规则挖掘算法,另一种也是典型的用户推荐算法协同过滤,具体采用的是协同过滤中item-based基于评分的简单易于实现的Weighted Slope One算法,最后比较算法的结果,采用了Weighted Slope One算法。
|
全文目录
摘要 5-6 Abstract 6-9 第一章 绪论 9-15 1.1 研究背景和意义 9-10 1.2 国内外研究现状 10-13 1.3 本文研究内容及章节安排 13-14 1.4 本章小结 14-15 第二章 相关技术分析及研究 15-27 2.1 主题搜索引擎概述 15-20 2.1.1 主题搜索的相关概念 15-16 2.1.2 主题搜索技术要点 16-20 2.2 数据挖掘概述 20-22 2.2.1 数据挖掘技术 20 2.2.2 数据挖掘的分类 20-22 2.3 开发技术简介 22-24 2.3.1 J2EE 架构 22-23 2.3.2 Spring Framework 23-24 2.3.3 Hibernate Framework 24 2.3.4 HtmlParser 24 2.4 信息推荐概述 24-26 2.5 本章小结 26-27 第三章 面向农产品的主题搜索系统分析 27-36 3.1 系统应用背景 27-28 3.2 系统功能 28-30 3.2.1 系统用例图 28-29 3.2.2 系统功能描述 29-30 3.3 系统架构 30-34 3.3.1 信息采集服务器 31 3.3.2 数据库服务器 31-32 3.3.3 Web 服务器 32-33 3.3.4 客户端软件 33-34 3.4 系统运行环境 34-35 3.4.1 用户运行环境 34-35 3.4.2 服务器运行环境 35 3.5 本章小结 35-36 第四章 农产品主题搜索系统的设计与实现 36-60 4.1 系统总体设计 36-37 4.2 Web 服务器架构设计 37-39 4.3 信息采集模块设计与实现 39-45 4.3.1 模块框架 39-40 4.3.2 信息抽取和保存 40-44 4.3.3 主要的包结构 44-45 4.4 信息推荐模块的设计与实现 45-58 4.4.1 模块框架 46 4.4.2 模块中选用的算法 46-55 4.4.3 关联规则和 Slope One 算法性能比较 55-58 4.4.4 主要类和方法介绍 58 4.5 本章小结 58-60 第五章 系统现状和性能 60-67 5.1 测试环境 60-61 5.2 信息采集模块测试及用户推荐模块测试 61-62 5.3 关联规则与 Slope One 性能比较 62-63 5.4 综合测试 63-66 5.5 本章小结 66-67 结论 67-69 参考文献 69-72 致谢 72
|
相似论文
- 基于数据挖掘的税务稽查选案研究,F812.42
- 基于自然遗忘的个性化推荐算法研究,TP311.52
- 基于关联规则的结构化浏览技术及其应用,TP391.41
- 数据挖掘技术在独立学院教学评估中的应用研究,TP311.13
- 基于蚁群算法的移动商务个性化推荐体系研究,TP391.3
- 基于关联规则和图排序的句子情感倾向性研究,TP391.1
- 基于C2C电子商务模式下商品推荐系统应用研究,F724.6
- 再生障碍性贫血中医证候分型文献的数据挖掘研究,R259
- 基于关联规则的入侵检测系统设计与实现,TP393.08
- 基于数据挖掘的故障诊断方法研究,TP311.13
- Agent电子商务推荐系统下协同过滤技术研究,F713.36
- 数据挖掘技术在高校教学管理系统中的应用研究,TP311.13
- 基于双信息源的协同过滤算法及其应用研究,TP301.6
- 面向企业竞争情报的主题搜索研究与实现,TP391.3
- 基于组件技术与数据仓库的经济金融学虚拟实验教学系统研究,TP311.52
- 基于ILP的多关系关联规则数据挖掘(MRDM)算法研究,TP311.13
- 基于协同过滤算法的个性化推荐系统的研究,TP393.09
- 数据挖掘在蜜罐日志分析中的应用研究,TP393.08
- 网络安全事件关联规则自动生成技术的研究与实现,TP393.08
- 协同过滤推荐系统中用户概貌攻击检测算法研究,TP393.08
- 基于协同过滤推荐算法电影网站的构建,TP393.092
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|