学位论文 > 优秀研究生学位论文题录展示

基于主动学习的智能算法及其在模式分类中的应用

作 者: 徐冉冉
导 师: 李朝锋
学 校: 江南大学
专 业: 计算机软件与理论
关键词: 主动学习 支持向量机 非平衡二叉树 模糊C均值聚类 多类分类
分类号: TP181
类 型: 硕士论文
年 份: 2013年
下 载: 10次
引 用: 0次
阅 读: 论文下载
 

内容摘要


支持向量机是由Vpnik V等人在二十世纪九十年代提出来的,是一种统计学习理论的学习机制,具有很强的学习能力,以及很好的推广性,近几年被广泛应用于图像处理、数据挖掘、模式识别分类和回归分析等领域。在实际应用中,很容易获得大量的数据以及图片来做样本,但是这些数据或者图片往往是没有标签的,而且带标签的样本获得起来相对困难。如果要充分利用这些无标签的样本,则需要人工添加标签。如何减少人工添加样本标签的时间与代价,成为了研究热点,随着主动学习的提出,在支持向量机中加入了主动学习的思想有效地解决了该问题。另一方面,传统的支持向量机是做二类分类的,然而随着支持向量机在新的领域的不断应用,会发现很多实际问题都是多类分类问题,怎样将二分类支持向量机有效的推广到多类分类问题中,也成为了人们的研究焦点。分类器性能的好坏主要由分类准确率和训练速度确定,主动学习与多类分类思想的同时加入会带来一些令人满意的结果,首先,减少了训练样本,缩小代价;其次,又同时把二分类的问题推广到多类分类,加速支持向量机的分类速度的同时,提高分类准确率,使支持向量机更加良好的推广发展下去。本文主要的工作总结如下:(1)首先了解主动学习与多类分类支持向量机的研究现状及趋势,并重点对主动学习与多类分类的算法理论进行深入研究。(2)研究了一种通过类距离构造二叉树的非平衡主动学习支持向量机,从易到难依次进行分类。该方法不仅提高了训练速度,还有效减少了不可分区域,而且分类准确率得到了提高,并通过Iris数据集、Wine数据集、Satimage数据集以及遥感数据集的实验结果验证了该算法的性能优势。(3)通过对多类分类支持向量机以及二叉树支持向量机的进一步研究,本文又通过模糊C均值聚类的方法去构造二叉树,研究一种基于模糊C均值聚类的非平衡二叉树主动学习支持向量机。通过模糊C均值聚类算法找到最适合第一个分出来的类,以减少错误累积。该方法的分类准确率和训练速度也都得到了相应的提高,并通过Iris数据集、Wine数据集、Satimage数据集以及遥感数据集的实验结果验证了算法的良好性能。

全文目录


摘要  3-4
Abstract  4-5
目录  5-8
第一章 绪论  8-14
  1.1 智能算法概述  8-9
    1.1.1 支持向量机研究现状  8-9
    1.1.2 模糊 C 均值聚类研究现状  9
  1.2 主动学习概述  9-10
  1.3 本文的研究意义  10-11
  1.4 论文研究的主要内容以及结构安排  11-14
第二章 支持向量机与主动学习算法介绍  14-26
  2.1 统计学习理论  14-16
    2.1.1 函数集的 VC 维  14-15
    2.1.2 推广误差的界  15
    2.1.3 结构风险最小化(Structural Risk Minimization, SRM)  15-16
  2.2 支持向量机的算法原理  16-22
    2.2.1 最优超平面  17
    2.2.2 线性可分支持向量机  17-19
    2.2.3 线性不可分情况的处理  19-20
    2.2.4 非线性支持向量机  20-21
    2.2.5 SVM 分类器参数选择  21-22
  2.3 主动学习算法  22-24
    2.3.1 算法原理  22-23
    2.3.2 主动学习采样策略  23-24
    2.3.3 主动学习支持向量机(ASVM)的简单算法步骤  24
  2.4 本章小结  24-26
第三章 非平衡二叉树主动学习支持向量机(NBT-ASVM)  26-42
  3.1 多类分类支持向量机  26-30
    3.1.1 一对多方法  27
    3.1.2 一对一方法  27-29
    3.1.3 有向无环图(Decision Directed Acyclic Graph, DDAG)方法  29
    3.1.4 二叉树方法  29-30
  3.2 非平衡二叉树主动学习支持向量机(NBT-ASVM)  30-32
    3.2.1 确定二叉树结构  30-31
    3.2.2 构造非平衡二叉树  31-32
    3.2.3 非平衡二叉树主动学习支持向量机的算法思想  32
    3.2.4 确定主动学习采样策略  32
    3.2.5 实验步骤  32
  3.3 实验结果分析  32-41
    3.3.1 Iris 数据实验结果与分析  33-34
    3.3.2 Wine 数据实验结果与分析  34-37
    3.3.3 Satimage 数据实验结果与分析  37-38
    3.3.4 遥感数据实验结果与分析  38-41
  3.4 本章小结  41-42
第四章 基于模糊 C 均值聚类的非平衡二叉树主动支持向量机  42-56
  4.1 模糊 C 均值聚类算法  42-43
    4.1.1 模糊聚类  42
    4.1.2 模糊 C 均值聚类算法  42-43
  4.2 利用模糊 C 均值聚类算法构造二叉树  43-44
  4.3 模糊 C 均值聚类非平衡二叉树主动学习支持向量机  44-45
    4.3.1 本章算法的算法思想  44
    4.3.2 本章算法的实验步骤  44-45
  4.4 实验结果分析  45-54
    4.4.1 Iris 数据集的实验结果与分析  45-47
    4.4.2 Wine 数据集的实验结果与分析  47-49
    4.4.3 Satimage 数据集的实验结果与分析  49-51
    4.4.4 遥感数据集的实验结果与分析  51-54
  4.5 本章小结  54-56
主要结论与展望  56-57
  主要结论  56
  展望  56-57
致谢  57-58
参考文献  58-61
附录: 作者在攻读硕士学位期间发表的论文  61

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  4. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  5. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  6. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  7. 细菌聚类算法及其在图像分割问题中的研究与应用,TP391.41
  8. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  9. 基于车载3D加速传感器的路况监测研究,TP274
  10. 基于特征选择的入侵检测研究,TP393.08
  11. 基于MRI灌注的计算机辅助肝脏病变检测,R445.2
  12. 基于模糊聚类的图像检索方法研究及其系统实现,TP391.41
  13. 基于机器学习的入侵检测系统研究,TP393.08
  14. 人类抗原肽载体结合力预测,R392.1
  15. 改进的模糊C均值聚类算法及其应用,O159
  16. 支持向量机理论及其应用,O212.1
  17. 集合多标签文本分类研究,TP391.1
  18. 模糊C均值聚类算法的相关问题研究,TP311.13
  19. 基于正则化方法的模糊C-均值聚类算法的研究,TP311.13
  20. 基于支持向量机的胎面胶损耗因子优化,U463.341
  21. 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com