学位论文 > 优秀研究生学位论文题录展示
农业知识推送模型及向量特征项提取算法研究
作 者: 王娟
导 师: 方逵
学 校: 湖南农业大学
专 业: 农业信息化技术
关键词: 推荐系统 特征提取 TF-IDF TF-IDF-IG 改进算法
分类号: F320.1
类 型: 硕士论文
年 份: 2011年
下 载: 70次
引 用: 1次
阅 读: 论文下载
内容摘要
在“十二五”期间,农业信息化已经明确成为我国社会发展和国民经济前进的重要任务。目前,信息技术在现代农业发展过程中的运用已经成为一种必然趋势,信息化服务成为许多发达国家农业科技推广与服务的主要方式之一。对于农业科技服务的主体—农民,如何在海量的信息中提取有价值或者农民感兴趣的信息成为农业信息化服务过程中文本信息研究处理的热点之一。湖南省农村信息综合服务平台引入信息推送技术,建立农业信息推送模块,该模块采用基于内容的推荐技术,通过建立农民兴趣模型和文档特征模型,对农民进行个性化的农业信息推送服务。在传统的推荐模块基础上,本平台考虑了用户不同的兴趣需求,以及整个模块的自适应修正问题,使本平台的推荐模块更满足农民的使用需要。同时,分析了传统的特征提取方法的不足,考虑特征项在不同表空间的分布情况以及HTML文档结构对计算特征项权重影响,并对传统算法进行了改进,并使用支撑词语义均衡化来减小方言对于特征词权重引起的偏斜问题。本文主要工作如下:(1)分析现有推荐技术的研究进展和各自的优缺点(2)提出湖南省农村信息服务平台下农业信息推送整体架构(3)在用户兴趣模型和文档特征模型中,分析现有特征提取方法TF-IDF和TF-IDF-IG,并得出其各自的不足。第一,TF-IDF算法只从特征项在文档和文档集合中的出现频率出发,没有考虑特征项在文档中的分布情况。另外,针对知识库中的文档数可能出现的在各产业类别中数据量极其不平衡问题,因此在进行特征项权重计算时应该设法消除这种数量级的差异。第二,TF-IDF-IG在一定程度上对TF-IDF的做了改进,但并不彻底,TF-IDF-IG只考虑了词语在整个文档集合中的分布情况,而没有考虑特征项在不同产业表空间的分布情况以及HTML文档结构对计算特征项权重影响。第三,由于本项目是基于农业数据的,农业数据与其他行业的数据相比,其有很强的地域性,因此还需要考虑方言对于特征项权重的影响,本文提出支撑词语义均衡化来解决这一问题。(4)从不同产业表空间的分布情况、HTML文档结构方面改进传统特征提取算法,并且通过分类器将用户兴趣进行分类,从而降低了用户兴趣模型与文档特征模型进行相似度计算时的计算量。(5)将改进的算法与TF-IDF、TF-IDF-IG算法在分类器上进行实验对比其Precision、Recall、F1值。首先,通过本项目组自主开发的农业spider程序在internet上爬取海量的农业信息作为测试数据。然后,随机选取用户数目N=25、50、100、200的4组用户作为模拟用户进行实验,并得出推送模型的Precision、Recall、F1值。实验说明改进算法是可行有效的,当用户呈倍数增长时,推送模型的Precision、Recall、F1值也在增长,说明本模型随着其计算量的增大,其精确度收敛,具有很好的扩展性。
|
全文目录
相似论文
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 空间交会接近视觉测量方法研究,TP391.41
- 基于视觉的番木瓜外观品质检测技术研究,S667.9
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于本体的中文科技论文分类研究,TP391.1
- 基于无线Mesh的无线传感器网络模拟与研究,TP212.9
- 3G系统盲多用户检测算法的研究,TN929.5
- 基于球面调和的三维模型检索系统研究与实现,TP391.41
- 基于数据挖掘技术的金融指数预测,F830
- 终身学习个性化推荐系统中学习者个人能力发展研究,G77
- B超仪中纹理特征量化功能的设计与实现,TP391.41
- 基于图像处理的集聚纺网格圈质量检测,TP391.41
- CT图像中肺结节胸膜凹陷征与空洞征的提取,TP391.41
- MIMO系统信号检测方法及球检测改进算法的研究,TN919.3
中图分类: > 经济 > 农业经济 > 中国农业经济 > 方针政策及其阐述 > 农业现代化道路、模式
© 2012 www.xueweilunwen.com
|