学位论文 > 优秀研究生学位论文题录展示
基于混合集成分类器的数据流概念漂移挖掘方法研究
作 者: 桂林
导 师: 胡学钢
学 校: 合肥工业大学
专 业: 计算机软件与理论
关键词: 数据流 集成学习 概念漂移
分类号: TP181
类 型: 硕士论文
年 份: 2012年
下 载: 33次
引 用: 0次
阅 读: 论文下载
内容摘要
随着网络通信、计算机科学与信息技术的发展,数据流作为一种新的数据形式在金融数据分析、网络监控、电信数据处理与传感器网络等领域有着广泛的应用。它们数量庞大并蕴含着丰富的信息亟待挖掘。相对于静态数据,数据流具有连续性、快速性、无限性和变化性的特点,这给传统算法和应用系统都带来了巨大的挑战。尤其是数据流中隐含的概念漂移现象大大增加了数据流上研究工作的难度。本文主要针对数据流上的概念漂移问题做了以下工作:(1)介绍了数据流的定义、特点及数据流挖掘模型的特点,概述了处理概念漂移数据流的技术与方法。(2)针对数据流中的概念漂移检测问题,提出了一种基于混合集成方法的数据流概念漂移检测方法WE-DTB。该模型以C4.5为基分类器建立集成模型,利用朴素贝叶斯分类器降低噪音影响,利用典型的Hoeffding Bounds和μ检验来进行数据流环境下的概念漂移检测。实验结果表明,与其它集成模型相比,WE-DTB能够有效检测概念漂移且具有较好的分类精度以及时空性能。(3)实现了AP,AE与WE-DTB三大数据流分类算法,并成功的将这三大算法配合Hoeffding Bounds,μ检验和DDM三个典型的概念漂移检测机制集成到了数据流分类原型系统PSDSC中。利用该系统,可以在相同的平台下比较不同数据流分类算法间的性能差异。
|
全文目录
摘要 5-6 Abstract 6-7 致谢 7-10 插图清单 10-11 表格清单 11-12 第一章 绪论 12-18 1.1 引言 12 1.2 本文的研究背景和意义 12-13 1.3 课题来源 13 1.4 数据流的介绍及应用 13-15 1.4.1 数据流的定义 13-14 1.4.2 数据流的特点 14 1.4.3 数据流的应用领域 14-15 1.5 数据流挖掘模型特点 15 1.6 数据流处理的理论基础与技术 15-17 1.6.1 基于数据的技术 16-17 1.6.2 基于任务的技术 17 1.7 本章小结 17-18 第二章 数据流概念漂移的研究 18-28 2.1 引言 18 2.2 数据流概念漂移的定义和分类 18-21 2.2.1 数据流中概念漂移的定义 18-19 2.2.2 数据流中概念漂移的分类 19-21 2.3 数据流概念漂移的处理方法 21-22 2.3.1 基于事例选择的概念漂移处理方法 21 2.3.2 基于事例加权的概念漂移处理方法 21 2.3.3 基于集成学习的概念漂移处理方法 21-22 2.4 数据流概念漂移问题的研究进展 22-25 2.4.1 概念漂移数据流的学习系统 22-23 2.4.2 概念漂移数据流理论上的研究进展 23-24 2.4.3 概念漂移数据流的学习算法 24-25 2.5 已有的集成模型介绍 25-27 2.6 本章小结 27-28 第三章 一种基于混合集成方法的数据流概念漂移检测方法 28-39 3.1 引言 28 3.2 相关工作介绍 28-31 3.2.1 数据流上的研究假设 28-30 3.2.2 数据流挖掘的集成方法介绍 30-31 3.3 算法描述 31-34 3.4 算法分析 34 3.5 实验性能分析 34-38 3.5.1 数据集的选择 35 3.5.2 实验结果分析 35-38 3.6 本章小结 38-39 第四章 数据流分类原型系统 39-48 4.1 引言 39 4.2 系统结构介绍 39-40 4.2.1 主界面介绍 39 4.2.2 数据流原型系统算法布局图 39-40 4.3 概念漂移检测 40-45 4.3.1 Hoeffding Bounds 40-42 4.3.2 检验 42-44 4.3.3 DDM 44-45 4.4 系统运行与结果展示 45-47 4.4.1 算法特征数据库的读取 45 4.4.2 算法参数的设定 45-46 4.4.3 算法的运行与结果展示 46-47 4.5 本章小结 47-48 第五章 总结与展望 48-50 5.1 本文总结 48 5.2 工作展望 48-50 参考文献 50-54 研究生期间参加科研与成果 54-55
|
相似论文
- 汽车售后配件管理系统的设计与运行研究,F426.471
- 基于数据流挖掘技术的流量识别,TP393.06
- 基于知识整合的数据流分类算法研究,TP311.13
- 云计算平台上的增量学习研究,TP311.13
- 基于GPU的时间序列并行检索算法研究,TP391.41
- 面向LTE的高性能向量浮点MAC单元的研究与实现,TN929.5
- 基于数据挖掘算法的蛋白质相互作用及其活性位点研究,TP311.13
- 基于基因表达谱的肿瘤分类方法研究,R730.2
- 基于滑动窗口的数据流预测聚集查询处理的研究,TP311.13
- 基于集成学习的垃圾短信多级分类技术研究,TN929.53
- 集成学习算法研究,TP181
- 基于专家委员会的主动学习算法研究,TP181
- 集成学习及其应用研究,TP181
- 基于递归神经网络与集成算法的时间序列预测应用研究,TP183
- 基于粒子群优化算法的支持向量机集成学习方法研究,TP181
- 基于多任务的多层次选择性集成学习的研究,TP181
- 基于行为特征的P2P流识别技术的研究,TP393.02
- 朴素贝叶斯分类器的集成学习方法研究,TP181
- 决策森林的子空间选择和集成优化,TP181
- 基于半监督分类的入侵检测系统模型研究,TP393.08
- 基于子空间的高维数据流聚类算法研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com
|