学位论文 > 优秀研究生学位论文题录展示

基于欠采样不均衡数据SVM算法与应用

作 者: 张冬雪
导 师: 陶新民
学 校: 哈尔滨工程大学
专 业: 信号与信息处理
关键词: 不均衡数据 支持向量机 谱聚类 精简集 故障检测
分类号: TP18
类 型: 硕士论文
年 份: 2013年
下 载: 34次
引 用: 0次
阅 读: 论文下载
 

内容摘要


支持向量机(Support Vector Machine, SVM)算法是以统计学习理论为基础的一种机器学习方法,它以其扎实的理论基础以及完整的理论推导,成为处理小样本学习、非线性、局部极小值等问题的有效工具。之前的神经网络学习方法,时常在速度、稳定性以及泛华能力方面出现种种问题,但是支持向量机方法却在这些方面达到了较为满意的效果。由于支持向量机算法通常研究的是均衡状态下数据的分类,然而在数据不均衡的状况下,效果很不理想,因此对于处理不均衡数据下支持向量机算法的研究成为了近些年很多学者们的关注对象。在支持向量机算法的基础上对数据层和算法层上进行改进,可以使数据达到均衡。在数据层的处理方面,少数类数据通常运用过采样的处理方式,而多数类数据通常都是使用欠采样的方法作出改进。本论文对于如何使不均衡数据通过欠采样方式达到均衡,提出了两种不同的算法,一种为基于谱聚类欠采样不均衡数据SVM算法,另一种为基于精简集欠采样不均衡数据SVM算法。谱聚类欠采样算法在处理数据层上时,将多数类数据在核空间里使用谱聚类方法,对具有代表性的数据点与少数类数据进行样本训练,在得到良好的分类界限的同时提高了分类性能,并在算法的最后与其他不同算法进行了对比。基于精简集欠采样不均衡数据SVM算法除了考虑不均衡数据SVM分类性能,还对算法的速度进行了一定研究与学习,该算法在保持原多数类数据空间结构不变的前提下,在核空间中进行精简集算法处理,通过对多数类数据权重的确定和数据样本到多数类数据中心的距离选择出具有代表性的向量。由于算法是对于精简集的支持向量进行训练,所以在运算速度上有大大地提升,在算法的最后同样与其他分类算法进行了对比分析。本论文的最后将提出的谱聚类欠采样算法应用到了故障检测的领域,在轴承检测上分别对滚动体故障、外圈故障以及内圈故障进行了相关数据的相应检测,同时对检测中的参数在算法中所起到的作用加以分析,使该算法应用到实际情况之中,让支持向量机算法在不均衡数据处理方面得到真正的应用。

全文目录


摘要  5-6
ABSTRACT  6-10
第1章 绪论  10-17
  1.1 研究背景  10-12
  1.2 国内国外研究问题情况  12-14
  1.3 论文目的与意义  14-15
  1.4 论文完成情况  15-17
第2章 支持向量机简述  17-27
  2.1 最优分界面  17-23
    2.1.1 构造最优分类界面  18-21
    2.1.2 广义上的最优分类界面  21-23
  2.2 支持向量机  23-25
  2.3 内积函数  25-26
  2.4 本章小结  26-27
第3章 基于谱聚类欠采样不均衡数据 SVM 算法  27-44
  3.1 谱聚类  27-30
    3.1.1 聚类方法  27-29
    3.1.2 谱聚类算法  29-30
  3.2 谱聚类欠采样不均衡数据 SVM 分类算法  30-32
    3.2.1 欠采样  30-31
    3.2.2 谱聚类欠采样 SVM 算法  31-32
  3.3 实验结果  32-42
    3.3.1 不均衡数据分类的性能评估指标  32-34
    3.3.2 实验数据的选取  34
    3.3.3 不同算法的分类性能比较  34-40
    3.3.4 不均衡数据在比例不相同情况下的分类性能比较  40-41
    3.3.5 高斯核半径的参数对算法性能的影响  41-42
  3.4 本章小结  42-44
第4章 基于精简集欠采样不均衡数据 SVM 算法  44-55
  4.1 精简集算法  44-47
    4.1.1 数据空间结构  44-45
    4.1.2 向量精简模型  45-47
    4.1.3 非线性多参数向量精简优化模型的求解  47
  4.2 精简集不均衡数据 SVM 分类算法  47-49
    4.2.1 精简集欠采样下分类界限  47-48
    4.2.2 精简集过采样下分类界限  48-49
  4.3 实验结果  49-54
    4.3.1 实验数据  49
    4.3.2 不同算法分类性能比较  49-54
    4.3.3 算法速度的比较实验  54
  4.4 本章小结  54-55
第5章 基于谱聚类欠采样不均衡数据 SVM 故障检测  55-62
  5.1 故障检测的意义  55-56
  5.2 故障检测的参量选取  56
  5.3 检测实验分析  56-60
    5.3.1 故障检测对比  57-59
    5.3.2 高斯核半径参数对 SVM 性能的影响  59
    5.3.3 检测速度对比试验  59-60
  5.4 本章小结  60-62
结论  62-64
参考文献  64-69
攻读硕士学位期间发表的论文和取得的科研成果  69-70
致谢  70

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于图分割的文本提取方法研究,TP391.41
  10. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  11. 基于图像的路面破损识别,TP391.41
  12. 基于支持向量机的故障诊断方法研究,TP18
  13. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  14. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  15. 移动计算环境下故障结点检测方法研究,TP338.8
  16. 面向嵌入式软件故障定位的程序谱方法研究,TP311.52
  17. 仿射型非线性系统智能故障诊断与容错控制研究,TP13
  18. 基于核偏最小二乘的故障诊断方法研究,TP277
  19. 太阳能热水器采暖控制系统的设计,TP273
  20. 线缆故障检测抢修辅助系统研制,TM247
  21. 基于二维动态核Hebbian算法的非线性过程故障检测方法研究,TP277

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com