学位论文 > 优秀研究生学位论文题录展示
面向不平衡数据的结构化支持向量机集成方法研究
作 者: 袁兴梅
导 师: 杨明
学 校: 南京师范大学
专 业: 计算机软件与理论
关键词: 不平衡数据 支持向量机 欠采样 代价敏感 集成学习
分类号: TP18
类 型: 硕士论文
年 份: 2011年
下 载: 63次
引 用: 0次
阅 读: 论文下载
内容摘要
不平衡数据在实际应用中广泛存在,如何从不平衡数据中学习并获得分类器成为了当前机器学习研究领域的一个热点。该方面的研究已经取得了一定的成果,并在入侵检测、信用卡交易和基因编码信息发现等应用领域得到了广泛的应用。已有的针对均衡数据或代价不敏感的分类器评价准则对不平衡数据不再适合,因为不平衡数据的分类器更关注少数的分类精度。针对不平衡数据的分类问题,研究者侧重从数据层面、算法层面和评价准则等三个方面展开研究,取得了一定的进展。在已有的针对不平衡数据的分类学习方法中,支持向量机(SVM)的变种成了主流的方法之一,如:结构化不平衡支持向量机(StASVM),该模型是在不平衡支持向量机(ASVM)的基础上,引入数据类内结构先验信息,有效地提高了分类器的性能。本文以StASVM模型为基础,结合集成学习方法,提出了基于结构化支持向量机的集成学习,主要工作如下:1.提出了基于StASVM的集成算法(EStASVM)。对大类样本进行聚类并进行基于聚类的欠采样,进而构建多个子分类器,从而设计出子分类器的集成算法,其中欠采样可有效地降低类别的不平衡性。实验表明,集成方法能够有效地提高算法的稳定性和分类性能。2.提出了基于随机子空间、特征选择和StASVM的集成算法(RsStASVM)。该算法为从数据集的特征空间随机采样出发,生成多个新的样本特征空间,进而诱导出多个子分类器,从而设计出子分类器的集成算法。实验表明,该方法对不平衡数据的分类,尤其能有效改进高维数据的分类性能。3.设计了一种基于代价敏感及AdaBoost的集成算法(AdaStASVM)。为进一步改进EStASVM和RsStASVM未能充分利用样本固有隐含信息的不足,AdaStASVM算法先对大类样本进行聚类,依据聚类结果对样本进行初始加权,并采用Adaboost算法思想对样本的权进行动态调整,侧重增大小类的错分样本的权值。实验表明,该算法可进一步改进EStASVM和RsStASVM的分类性能。
|
全文目录
摘要 4-5 Abstract 5-7 目录 7-9 第1章 绪论 9-13 1.1 研究背景 9 1.2 国内外现状 9-11 1.3 主要工作 11-12 1.4 内容安排 12-13 第2章 不平衡数据分类的几种典型技术 13-21 2.1 数据层面的处理方法 13-15 2.1.1 过采样 13-14 2.1.2 欠采样 14-15 2.2 算法层面的处理方法 15-19 2.2.1 代价敏感方法 15-16 2.2.2 集成学习方法 16-17 2.2.3 基于支持向量机的方法 17-18 2.2.4 其他方法 18-19 2.3 几种典型的分类评价准则 19-20 2.4 本章小结 20-21 第3章 一种面向不平衡数据的结构化SVM集成算法 21-30 3.1 引言 21 3.2 Bagging简介 21-23 3.3 结构化不平衡支持向量机介绍 23-24 3.4 EStASVM算法 24-29 3.4.1 算法思想 25 3.4.2 EStASVM算法描述 25-27 3.4.3 算法结果与分析 27-29 3.5 本章小结 29-30 第4章 基于随机子空间的结构化SVM集成算法 30-39 4.1 引言 30 4.2 随机子空间方法 30 4.3 特征选择 30-32 4.4 RsStASVM算法 32-38 4.4.1 算法思想 32-34 4.4.2 RsStASVM算法描述 34-35 4.4.3 算法结果与分析 35-38 4.5 本章小结 38-39 第5章 基于代价敏感及Adaboost的SVM集成分类器 39-49 5.1 引言 39 5.2 AdaBoost方法 39-40 5.3 代价敏感支持向量机 40-42 5.4 AdaStASVM算法 42-47 5.4.1 AdaStASVM算法思想 42-44 5.4.2 实验结果与分析 44-47 5.5 本章小结 47-49 第6章 结束语 49-51 参考文献 51-56 附录 56-57 致谢 57
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于机器学习的入侵检测系统研究,TP393.08
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于AdaBoost算法的人脸识别研究,TP391.41
- 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
- 城市污水处理厂中A~2O工艺过程的建模研究,X703
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|