学位论文 > 优秀研究生学位论文题录展示

基于核空间预处理不均衡SVM算法及应用研究

作 者: 郝思媛
导 师: 陶新民
学 校: 哈尔滨工程大学
专 业: 通信与信息系统
关键词: 不均衡问题 核聚类欠采样 AdaBoost 样本特性 故障诊断
分类号: TP18
类 型: 硕士论文
年 份: 2013年
下 载: 16次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在各个领域中不均衡数据问题都广泛的存在,如医疗领域、故障诊断领域以及欺诈检测领域等。因此对不均衡数据进行研究且找到有效的分类算法具有重大的科学意义和应用价值。然而较为经典的分类算法当它们应用到故障领域时,它们的分类性能都不是很理想。此外,在故障诊断领域,因为支持向量机具有收敛速度快、稳定性强以及泛化能力强等特点,支持向量机分类算法早已代替了神经网络算法。本文以支持向量机为基础分类算法,重点研究了如何将SVM在不均衡数据下的分类界面向着多数类样本进行适当移动。首先介绍了不均衡问题的本质及其经典的算法、机器故障诊断的研究现状,且对有关的基础知识进行分析和研究,为了选择出信息量大同时代表多数类空间结构的多数类样本,提出了核聚类欠取样集成的不均衡数据SVM分类算法,算法利用核聚类欠采样算法在核空间对多数类样本进行聚类,这一过程称之为核聚类,然后从每个聚类中选择出代表性强的多数类样本,同原始少数类样本一起作为训练样本,对基分类器SVM进行学习。另一方面,所得到的基分类器具有很大的差异性且满足一定的分类精度,所以提出利用AdaBoost集成算法对基分类器进行集成进而提高算法的分类精度。通过仿真实验可知,该算法较其他的一些不均衡分类算法不仅在性能上也在算法的复杂度上有了很大程度的改善。其次介绍了基于样本特性欠采样的不均衡SVM算法,首先在核空间内使用欧式距离来选择信息量大的多数类样本,再基于样本密度信息公式选择最具有代表性的均衡多数类样本点,并且同少数类样本一起作为训练样本对分类器进行学习。实验表明此方案与其他的不均衡分类算法相比,鲁棒性、少数类的分类性能以及总体分类性能都有相应的改善。最后,将核聚类欠采样集成的不均衡数据SVM分类算法应用到故障诊断领域,通过实验验证了该方法取得了良好的效果。

全文目录


摘要  5-6
ABSTRACT  6-10
第1章 绪论  10-16
  1.1 课题研究的目的及意义  10-11
  1.2 不均衡问题的研究现状  11-13
    1.2.1 基于数据角度的解决方案  11-12
    1.2.2 基于算法角度的解决方案  12-13
  1.3 故障诊断的研究现状  13-14
  1.4 论文所完成工作以及结构  14-16
第2章 基于支持向量机不均衡数据分类的基本概述  16-29
  2.1 支持向量机  16-21
    2.1.1 线性支持向量机  16-19
    2.1.2 非线性支持向量机  19-21
  2.2 不均衡分类问题的本质及其影响  21-23
  2.3 聚类  23-27
    2.3.1 聚类的相似度衡量  23-26
    2.3.2 典型的聚类算法  26-27
  2.4 不均衡分类问题的性能指标  27-28
  2.5 本章小结  28-29
第3章 基于核聚类欠取样集成的不均衡数据 SVM 算法  29-49
  3.1 不均衡数据下的 SVM 算法的分类情况  30-31
  3.2 采样算法  31-33
  3.3 核聚类 SVM 算法  33-35
  3.4 ADABOOST 集成算法  35-38
  3.5 核聚类欠采样集成 SVM 算法复杂度的分析  38-39
  3.6 实验分析  39-48
    3.6.1 实验数据的选取  39
    3.6.2 不同数据预处理算法的分类性能比较  39-42
    3.6.3 不同比例下不均衡数据分类性能比较  42-43
    3.6.4 不同不均衡数据集成分类算法性能比较  43-47
    3.6.5 不同比例下不同算法的效率比较  47-48
  3.7 本章小节  48-49
第4章 基于样本特性欠取样不均衡 SVM 算法  49-55
  4.1 基于样本特性的欠采样方法  49-50
  4.2 基于样本特性欠采样不均衡 SVM 算法复杂度  50
  4.3 实验部分  50-54
    4.3.1 处理不均衡数据的分类情况  50-51
    4.3.2 实验数据的选取  51
    4.3.3 不同算法分类性能的比较  51-53
    4.3.4 高斯核半径对算法性能的影响  53-54
  4.4 本章小结  54-55
第5章 基于不均衡 SVM 算法的故障检测问题研究  55-62
  5.1 相空间的重构  55-58
    5.1.1 时间延迟参数的确定  56-57
    5.1.2 故障信号的特征提出  57-58
  5.2 故障诊断模型  58
  5.3 实验  58-61
    5.3.1 实验数据  58-59
    5.3.2 故障数据测试  59-61
  5.4 本章小结  61-62
结论  62-64
参考文献  64-68
攻读硕士学位期间发表的论文和取得的科研成果  68-70
致谢  70

相似论文

  1. 基于WinCE平台的故障分析仪应用程序设计与开发,TP311.52
  2. 八作动器隔振平台的六自由度容错控制研究,TB535.1
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 基于三维重建的焊点质量分类方法研究,TP391.41
  5. 舌体特征的提取及融合分类方法研究,TP391.41
  6. 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
  7. 唇读中的特征提取、选择与融合,TP391.41
  8. 基于支持向量机的故障诊断方法研究,TP18
  9. 三容水箱系统故障诊断算法研究,TP277
  10. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  11. RTAD-CMDMDES的总体设计和系统开发,U279.3
  12. 基于模糊神经网络的设备故障诊断专家系统,TP183
  13. 基于支持向量机的故障诊断研究,TH165.3
  14. 混凝土泵液压系统故障诊断方法研究,TU646
  15. 基于数据融合技术舞台故障诊断方法的研究,TP18
  16. 雷达电路板故障诊断系统硬件集成的研究与设计,E933.6
  17. 汽轮机加热器数学建模和运行故障诊断,U664.113
  18. 高压水除鳞系统实时压力监测与故障诊断,TG333
  19. 瞬态成分建模与参数辨识方法及其旋转机械故障诊断应用研究,TH165.3
  20. 基于GPRS的变压器故障诊断系统的研究,TM407
  21. 基于人工免疫方法的系统级故障诊断研究,TP338.6

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com