学位论文 > 优秀研究生学位论文题录展示

农业知识文本库检索系统关键技术研究

作 者: 王玉娟
导 师: 方逵
学 校: 湖南农业大学
专 业: 农业信息化技术
关键词: 农业知识库 检索系统 排序算法 Lucene 全文检索
分类号: TP391.3
类 型: 硕士论文
年 份: 2012年
下 载: 44次
引 用: 0次
阅 读: 论文下载
 

内容摘要


农业知识库作为现代农业科技信息化服务的基础和核心,其重要性不言而喻。而随着农业服务平台的构建及各类信息资源的增加,如何优化、整合农业信息资源、如何智能搜索信息及如何对接各类信息平台,保证信息的及时性与准确性就成为当前农业信息服务平台的一个中心课题。本文即以湖南省科技厅项目为背景,定位在农业知识库检索系统的构建,构建一个更适合农业更适应湖南的特色检索系统。主要工作有:1.结合湖南省农业知识库的特色,改进了基于向量空间模型建模的排序算法、归一化计算排序算法以及仿lucene打分计算方法,并对三个算法进行了评估;2.结合改进的层进式最短路径分词算法,在lucene索引的基础上,增加索引路径,增加农业词汇和非农业词汇融入索引词汇排序,设计并实现了适合湖南省农业知识库的索引;3.结合湖南省农业特色如方言、区域、主要产品等,进行系统和数据库的总体设计,对系统所需的各种模块进行性能、功能的剖析,构建系统详细总体架构图、检索系统主要工作流程图、时序图,提高检索系统性能和检索结果精准度;4.使用lucene全文检索工具包进行二次开发,构建了基于服务平台内部数据库的快速、智能化的信息检索系统,并基本达到能根据诉求农户的问题关键词,实现快速、智能搜索与匹配,形成准确答案,完成应诉的要求。

全文目录


摘要  4-5
Abstract  5-9
第一章 绪论  9-14
  1.1 课题研究背景  9-10
  1.2 国内外研究现状  10-12
    1.2.1 国外主要农业检索系统  10-11
    1.2.2 国内农业检索系统研究现状  11-12
  1.3 本文选题依据及研究意义  12
  1.4 本文研究目标及主要研究内容  12-13
  1.5 本文主要研究内容和结构安排  13-14
第二章 农业知识库相关理论与技术  14-25
  2.1 中文自动分词  14-16
    2.1.1 基于字符串匹配的分词方法  15
    2.1.2 基于统计的分词方法  15-16
    2.1.3 基于理解的分词方法  16
  2.2 倒排索引  16-17
  2.3 全文检索相关技术  17-21
    2.3.1 TF-IDF权重  17-18
    2.3.2 空间向量模型  18-19
    2.3.3 Lucene排序模型  19-21
  2.4 问答(QA)系统  21-24
    2.4.1 问答系统结构模型  21
    2.4.2 主要算法  21-24
  2.5 本章小结  24-25
第三章 检索排序算法研究及改进  25-32
  3.1 查询语句预处理  25-26
    3.1.1 关键词的提取  25-26
    3.1.2 关键词的分析  26
  3.2 信息检索  26-31
    3.2.1 关键词分析  27-28
    3.2.2 关键词位置加权  28
    3.2.3 匹配度计算  28-29
    3.2.4 记录加权  29-30
    3.2.5 相关度计算  30-31
  3.3 本章总结  31-32
第四章 系统设计与实现  32-50
  4.1 项目背景及难点  32-33
  4.2 框架设计思想  33-34
    4.2.1 软件分层设计思想  33-34
    4.2.2 模块化设计思想  34
  4.3 系统框架设计  34-36
  4.4 数据库设计  36-44
    4.4.1 数据库设计规则  36-37
    4.4.2 数据库表空间关系图  37-42
    4.4.3 数据库基本信息  42-44
  4.5 索引库设计  44-45
  4.6 开发环境及工具  45-46
    4.6.1 开发环境  45
    4.6.2 Lucene  45
    4.6.3 Struts+spring+hibernate  45-46
  4.7 系统实现  46-49
    4.7.1 倒排索引建立  46-47
    4.7.2 农业检索系统实现界面  47-49
  4.8 本章小结  49-50
第五章 系统的测试  50-54
  5.1 系统测试环境  50
  5.2 检索测试  50-51
  5.3 检索试验与算法评估  51-53
  5.4 本章小结  53-54
第六章 小结与展望  54-55
  6.1 总结  54
  6.2 未来工作展望  54-55
参考文献  55-59
致谢  59-60
作者简介  60

相似论文

  1. 用于检索的人脸特征提取与匹配算法研究,TP391.41
  2. 分面元数据在网站检索系统中的应用研究,G354.2
  3. 基于Lucene的网络文学垂直搜索引擎的研究与实现,TP391.3
  4. 基于OAI-PMH协议及全文检索技术的图书馆联合目录系统,TP391.3
  5. 全文检索及相关技术研究,TP391.3
  6. 基于WebGIS和MMS的移动搜索服务系统开发,TP311.52
  7. 消防领域搜索引擎系统的设计与实现,TP391.3
  8. LUCENE中文分词在科研文档全文检索系统的应用研究,TP311.52
  9. 基于MVC设计模式的网络服务平台的研究与实现,TP311.52
  10. 基于Lucene的知识库设计与实现,TP311.52
  11. 基于Lucene的电影票垂直搜索系统的设计与实现,TP391.3
  12. 面向元搜索引擎的Web页面排序优化技术研究与实现,TP393.09
  13. 全文检索系统研究,TP391.3
  14. 网络智能答疑系统的研究与实现,TP393.09
  15. 仿真资源云存储技术的研究与实现,TP333
  16. 多模式图像检索方法研究,TP391.41
  17. 数据库全文检索方法研究及其应用,TP311.13
  18. 基于Lucene.Net的全文检索研究与应用,TP391.3
  19. 公众论坛信息实时检索的研究与实现,TP391.3
  20. 基于内容的图像检索系统的设计与实现,TP311.52
  21. 企业短信互动系统设计及实现关键技术研究,TN929.53

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com