学位论文 > 优秀研究生学位论文题录展示
基于BP神经网络的WEB数据挖掘
作 者: 高伟华
导 师: 蓝雯飞
学 校: 中南民族大学
专 业: 计算机应用技术
关键词: 数据挖掘 BP神经网络 WEB内容挖掘 WEB文档分类 拓扑结构
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 183次
引 用: 2次
阅 读: 论文下载
内容摘要
WEB文本挖掘是WEB数据挖掘的一个研究方向,WEB文本挖掘过程中最重要的是如何对文档内容进行有效分类,文本分类精度越高,WEB查询结果就越接近于理想的要求,在实际的应用中越能够让使用者满意,所以如何设计一个高效的文本分类算法至关重要。在众多的分类算法里,BP神经网络算法因其:可以把一组样本的I/O问题变为一个非线性问题;实现I/O非线性映射;全局逼近网络;泛化能力等特点而被广泛应用。本文对WEB数据挖掘的发展和应用作了介绍,讨论了WEB数据挖掘的相关内容,并对使用的算法进行了概述,在前人工作的基础上,对WEB内容挖掘过程中涉及到的WEB文档分类的相关算法进行了讨论,着重对BP神经网络算法进行了深入的探讨,并在此基础上给出了自己的BP神经网络改进算法,将此算法应用在多子网并联拓扑结构上对WEB文档内容进行分类,实验结果表明改进算法的性能有了明显改善。论文具体的研究内容包括以下几方面:⑴介绍了论文的研究背景及意义,对数据挖掘的概念、数据挖掘的分类、使用的挖掘算法、数据挖掘的过程等进行了详细的阐述。⑵着重对WEB数据挖掘的内容,WEB数据挖掘的分类,WEB数据挖掘的过程进行了阐述,尤其对WEB内容挖掘的挖掘内容、挖掘过程、相关算法进行了详细的阐述。在WEB内容挖掘过程中,对文档内容进行分类非常重要。⑶论文对神经网络算法的内容、原理进行了阐述,尤其对BP神经网络算法详细阐述了其概念、原理、拓扑结构及优缺点等,针对其收敛率不高和误差偏大等特点,对算法进行了改进,提出了BP神经网络改进算法,提高了算法的收敛率并降低了误差。⑷多子网并联神经网络算法是通过优化普通三层BP神经网络算法的拓扑结构,从而提高BP神经网络算法性能的一种方法。本文把改进的BP神经网络算法和多子网并联拓扑结构结合使用,使得算法的分类能力有了更大的改进。实验结果表明使用多子网并联结构的BP改进算法进行WEB文档分类可行,且性能有了较大的提高。
|
全文目录
摘要 7-8 ABSTRACT 8-10 第一章 绪论 10-14 1.1 研究背景及意义 10-11 1.2 课题研究现状 11-12 1.3 论文的主要研究内容 12 1.4 论文的结构安排 12-14 第二章 WEB 数据挖掘技术 14-26 2.1 数据挖掘介绍 14-15 2.1.1 数据挖掘的由来 14 2.1.2 数据挖掘的内容 14-15 2.2 数据挖掘研究的分类 15-16 2.2.1 根据挖掘的数据库类型分类 16 2.2.2 根据采用的技术和方法分类 16 2.2.3 根据挖掘的知识类型分类 16 2.2.4 根据挖掘的应用领域分类 16 2.3 数据挖掘技术 16-19 2.3.1 决策树 16-17 2.3.2 神经网络 17 2.3.3 关联规则 17-18 2.3.4 聚类分析 18 2.3.5 统计学习 18 2.3.6 模糊集和粗糙集 18-19 2.4 数据挖掘过程 19-21 2.5 WEB 数据挖掘 21-25 2.5.1 WEB 数据挖掘介绍 21-22 2.5.2 WEB 挖掘的概念 22-23 2.5.3 WEB 挖掘的分类 23-25 2.6 本章小结 25-26 第三章 BP 神经网络算法介绍 26-38 3.1 神经网络介绍 26-29 3.2 BP 神经网络算法基本概念 29-30 3.3 BP 神经网络算法的基本结构 30-32 3.4 BP 神经网络算法的相关问题 32-33 3.5 BP 神经网络算法的特征及优点 33-34 3.6 改进的BP 神经网络算法 34-37 3.6.1 传统的改进BP 神经网络算法介绍 34-35 3.6.2 改进的BP 神经网络算法内容 35 3.6.3 改进的BP 神经网络算法实验结果 35-37 3.7 本章小结 37-38 第四章 基于BP 神经网络的WEB 文本挖掘 38-48 4.1 WEB 文本挖掘简述 38-40 4.2 WEB 文本分类算法 40-43 4.2.1 决策树(Decision Trees) 40-41 4.2.2 KNN 算法 41 4.2.3 贝叶斯网络算法 41-42 4.2.4 神经网络(Neural Networks) 42 4.2.5 Boosting 算法 42-43 4.2.6 支撑矢量机算法 43 4.3 使用改进的BP 神经网络算法的WEB 文本分类 43-46 4.3.1 文档特征提取 43 4.3.2 特征项集构造 43-44 4.3.3 特征向量的构造 44 4.3.4 多子网并联BP 网络模型 44 4.3.5 文档分类方案 44-45 4.3.6 应用实验结果 45-46 4.4 本章小结 46-48 第五章 总结和工作展望 48-50 5.1 总结 48 5.2 工作展望 48-50 致谢 50-51 参考文献 51-53 附录 攻读学位期间所发表的学术论文目录 53
|
相似论文
- 多层卫星网络稳定性设计研究,TN927.23
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 机械臂视觉伺服系统的研究,TP242.6
- 市级旅游用地规划环境影响评价研究,X820.3
- 珠三角地区高性能混凝土配合比智能化系统,TU528
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 大学生综合素质测评研究,G645.5
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
- 柔性、刚性混配配合物的合成与性质表征,O621.1
- 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
- 高速公路拆迁民众生存系统评价研究,D523
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 煤矿风险信息集成与智能预警研究,X936
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|