学位论文 > 优秀研究生学位论文题录展示

面向农产品信息的主题搜索引擎与信息推荐

作 者: 陈冰泉
导 师: 张平健;毛海峰
学 校: 华南理工大学
专 业: 软件工程
关键词: 主题搜索 关联规则 协同过滤 可定制搜索 Weighted Slope One
分类号: TP391.3
类 型: 硕士论文
年 份: 2010年
下 载: 93次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着Internet的不断发展,人们习惯将数据存放在Web上,也习惯从Web去浏览、查找他们所需要的信息。近10年Web信息每天以指数级的速度爆炸性地增长,且不断更新变化,使我们陷入了"Rich Data, Poor Information"的尴尬局面。我们面临一个很关键的问题,如何从浩瀚的Web海洋里面找到我们所需要的、对我们有用的信息。通用搜索引擎的出现解决了这个问题,它给用户提供了一个到达互联网的接口。但这个接口对任何用户都是一样的,无法满足用户对多样化信息的多样化要求。当用户需要深入互联网,获得分类细致即时更新的信息时,通用搜索显得力不从心,主题搜索随之诞生。本文致力于设计并实现一个面向农产品信息的主题搜索系统,并在该系统的基础上实现用户推荐。文中首先介绍了目前的搜索行业背景、垂直搜索在国内外的发展现状和趋势;接下来以搜索引擎原理、数据挖掘理论基础展开研究;分析并研究垂直搜索核心问题:如何解析与主题相关的Web信息并反馈给用户;在此基础上实现搜索的可定制;最后在得到领域相关信息的基础上,又考虑并实现如何能更进一步地方便用户,为用户作一些有价值的推荐信息。在为用户推荐信息环节,文中实现了两种算法,一种是在用户推荐领域久负盛名的关联规则挖掘算法,另一种也是典型的用户推荐算法协同过滤,具体采用的是协同过滤中item-based基于评分的简单易于实现的Weighted Slope One算法,最后比较算法的结果,采用了Weighted Slope One算法。

全文目录


摘要  5-6
Abstract  6-9
第一章 绪论  9-15
  1.1 研究背景和意义  9-10
  1.2 国内外研究现状  10-13
  1.3 本文研究内容及章节安排  13-14
  1.4 本章小结  14-15
第二章 相关技术分析及研究  15-27
  2.1 主题搜索引擎概述  15-20
    2.1.1 主题搜索的相关概念  15-16
    2.1.2 主题搜索技术要点  16-20
  2.2 数据挖掘概述  20-22
    2.2.1 数据挖掘技术  20
    2.2.2 数据挖掘的分类  20-22
  2.3 开发技术简介  22-24
    2.3.1 J2EE 架构  22-23
    2.3.2 Spring Framework  23-24
    2.3.3 Hibernate Framework  24
    2.3.4 HtmlParser  24
  2.4 信息推荐概述  24-26
  2.5 本章小结  26-27
第三章 面向农产品的主题搜索系统分析  27-36
  3.1 系统应用背景  27-28
  3.2 系统功能  28-30
    3.2.1 系统用例图  28-29
    3.2.2 系统功能描述  29-30
  3.3 系统架构  30-34
    3.3.1 信息采集服务器  31
    3.3.2 数据库服务器  31-32
    3.3.3 Web 服务器  32-33
    3.3.4 客户端软件  33-34
  3.4 系统运行环境  34-35
    3.4.1 用户运行环境  34-35
    3.4.2 服务器运行环境  35
  3.5 本章小结  35-36
第四章 农产品主题搜索系统的设计与实现  36-60
  4.1 系统总体设计  36-37
  4.2 Web 服务器架构设计  37-39
  4.3 信息采集模块设计与实现  39-45
    4.3.1 模块框架  39-40
    4.3.2 信息抽取和保存  40-44
    4.3.3 主要的包结构  44-45
  4.4 信息推荐模块的设计与实现  45-58
    4.4.1 模块框架  46
    4.4.2 模块中选用的算法  46-55
    4.4.3 关联规则和 Slope One 算法性能比较  55-58
    4.4.4 主要类和方法介绍  58
  4.5 本章小结  58-60
第五章 系统现状和性能  60-67
  5.1 测试环境  60-61
  5.2 信息采集模块测试及用户推荐模块测试  61-62
  5.3 关联规则与 Slope One 性能比较  62-63
  5.4 综合测试  63-66
  5.5 本章小结  66-67
结论  67-69
参考文献  69-72
致谢  72

相似论文

  1. 基于数据挖掘的税务稽查选案研究,F812.42
  2. 基于自然遗忘的个性化推荐算法研究,TP311.52
  3. 基于关联规则的结构化浏览技术及其应用,TP391.41
  4. 数据挖掘技术在独立学院教学评估中的应用研究,TP311.13
  5. 基于蚁群算法的移动商务个性化推荐体系研究,TP391.3
  6. 基于关联规则和图排序的句子情感倾向性研究,TP391.1
  7. 基于C2C电子商务模式下商品推荐系统应用研究,F724.6
  8. 再生障碍性贫血中医证候分型文献的数据挖掘研究,R259
  9. 基于关联规则的入侵检测系统设计与实现,TP393.08
  10. 基于数据挖掘的故障诊断方法研究,TP311.13
  11. Agent电子商务推荐系统下协同过滤技术研究,F713.36
  12. 数据挖掘技术在高校教学管理系统中的应用研究,TP311.13
  13. 基于双信息源的协同过滤算法及其应用研究,TP301.6
  14. 面向企业竞争情报的主题搜索研究与实现,TP391.3
  15. 基于组件技术与数据仓库的经济金融学虚拟实验教学系统研究,TP311.52
  16. 基于ILP的多关系关联规则数据挖掘(MRDM)算法研究,TP311.13
  17. 基于协同过滤算法的个性化推荐系统的研究,TP393.09
  18. 数据挖掘在蜜罐日志分析中的应用研究,TP393.08
  19. 网络安全事件关联规则自动生成技术的研究与实现,TP393.08
  20. 协同过滤推荐系统中用户概貌攻击检测算法研究,TP393.08
  21. 基于协同过滤推荐算法电影网站的构建,TP393.092

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com