学位论文 > 优秀研究生学位论文题录展示
基于主动学习的智能算法及其在模式分类中的应用
作 者: 徐冉冉
导 师: 李朝锋
学 校: 江南大学
专 业: 计算机软件与理论
关键词: 主动学习 支持向量机 非平衡二叉树 模糊C均值聚类 多类分类
分类号: TP181
类 型: 硕士论文
年 份: 2013年
下 载: 10次
引 用: 0次
阅 读: 论文下载
内容摘要
支持向量机是由Vpnik V等人在二十世纪九十年代提出来的,是一种统计学习理论的学习机制,具有很强的学习能力,以及很好的推广性,近几年被广泛应用于图像处理、数据挖掘、模式识别分类和回归分析等领域。在实际应用中,很容易获得大量的数据以及图片来做样本,但是这些数据或者图片往往是没有标签的,而且带标签的样本获得起来相对困难。如果要充分利用这些无标签的样本,则需要人工添加标签。如何减少人工添加样本标签的时间与代价,成为了研究热点,随着主动学习的提出,在支持向量机中加入了主动学习的思想有效地解决了该问题。另一方面,传统的支持向量机是做二类分类的,然而随着支持向量机在新的领域的不断应用,会发现很多实际问题都是多类分类问题,怎样将二分类支持向量机有效的推广到多类分类问题中,也成为了人们的研究焦点。分类器性能的好坏主要由分类准确率和训练速度确定,主动学习与多类分类思想的同时加入会带来一些令人满意的结果,首先,减少了训练样本,缩小代价;其次,又同时把二分类的问题推广到多类分类,加速支持向量机的分类速度的同时,提高分类准确率,使支持向量机更加良好的推广发展下去。本文主要的工作总结如下:(1)首先了解主动学习与多类分类支持向量机的研究现状及趋势,并重点对主动学习与多类分类的算法理论进行深入研究。(2)研究了一种通过类距离构造二叉树的非平衡主动学习支持向量机,从易到难依次进行分类。该方法不仅提高了训练速度,还有效减少了不可分区域,而且分类准确率得到了提高,并通过Iris数据集、Wine数据集、Satimage数据集以及遥感数据集的实验结果验证了该算法的性能优势。(3)通过对多类分类支持向量机以及二叉树支持向量机的进一步研究,本文又通过模糊C均值聚类的方法去构造二叉树,研究一种基于模糊C均值聚类的非平衡二叉树主动学习支持向量机。通过模糊C均值聚类算法找到最适合第一个分出来的类,以减少错误累积。该方法的分类准确率和训练速度也都得到了相应的提高,并通过Iris数据集、Wine数据集、Satimage数据集以及遥感数据集的实验结果验证了算法的良好性能。
|
全文目录
摘要 3-4 Abstract 4-5 目录 5-8 第一章 绪论 8-14 1.1 智能算法概述 8-9 1.1.1 支持向量机研究现状 8-9 1.1.2 模糊 C 均值聚类研究现状 9 1.2 主动学习概述 9-10 1.3 本文的研究意义 10-11 1.4 论文研究的主要内容以及结构安排 11-14 第二章 支持向量机与主动学习算法介绍 14-26 2.1 统计学习理论 14-16 2.1.1 函数集的 VC 维 14-15 2.1.2 推广误差的界 15 2.1.3 结构风险最小化(Structural Risk Minimization, SRM) 15-16 2.2 支持向量机的算法原理 16-22 2.2.1 最优超平面 17 2.2.2 线性可分支持向量机 17-19 2.2.3 线性不可分情况的处理 19-20 2.2.4 非线性支持向量机 20-21 2.2.5 SVM 分类器参数选择 21-22 2.3 主动学习算法 22-24 2.3.1 算法原理 22-23 2.3.2 主动学习采样策略 23-24 2.3.3 主动学习支持向量机(ASVM)的简单算法步骤 24 2.4 本章小结 24-26 第三章 非平衡二叉树主动学习支持向量机(NBT-ASVM) 26-42 3.1 多类分类支持向量机 26-30 3.1.1 一对多方法 27 3.1.2 一对一方法 27-29 3.1.3 有向无环图(Decision Directed Acyclic Graph, DDAG)方法 29 3.1.4 二叉树方法 29-30 3.2 非平衡二叉树主动学习支持向量机(NBT-ASVM) 30-32 3.2.1 确定二叉树结构 30-31 3.2.2 构造非平衡二叉树 31-32 3.2.3 非平衡二叉树主动学习支持向量机的算法思想 32 3.2.4 确定主动学习采样策略 32 3.2.5 实验步骤 32 3.3 实验结果分析 32-41 3.3.1 Iris 数据实验结果与分析 33-34 3.3.2 Wine 数据实验结果与分析 34-37 3.3.3 Satimage 数据实验结果与分析 37-38 3.3.4 遥感数据实验结果与分析 38-41 3.4 本章小结 41-42 第四章 基于模糊 C 均值聚类的非平衡二叉树主动支持向量机 42-56 4.1 模糊 C 均值聚类算法 42-43 4.1.1 模糊聚类 42 4.1.2 模糊 C 均值聚类算法 42-43 4.2 利用模糊 C 均值聚类算法构造二叉树 43-44 4.3 模糊 C 均值聚类非平衡二叉树主动学习支持向量机 44-45 4.3.1 本章算法的算法思想 44 4.3.2 本章算法的实验步骤 44-45 4.4 实验结果分析 45-54 4.4.1 Iris 数据集的实验结果与分析 45-47 4.4.2 Wine 数据集的实验结果与分析 47-49 4.4.3 Satimage 数据集的实验结果与分析 49-51 4.4.4 遥感数据集的实验结果与分析 51-54 4.5 本章小结 54-56 主要结论与展望 56-57 主要结论 56 展望 56-57 致谢 57-58 参考文献 58-61 附录: 作者在攻读硕士学位期间发表的论文 61
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 细菌聚类算法及其在图像分割问题中的研究与应用,TP391.41
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于车载3D加速传感器的路况监测研究,TP274
- 基于特征选择的入侵检测研究,TP393.08
- 基于MRI灌注的计算机辅助肝脏病变检测,R445.2
- 基于模糊聚类的图像检索方法研究及其系统实现,TP391.41
- 基于机器学习的入侵检测系统研究,TP393.08
- 人类抗原肽载体结合力预测,R392.1
- 改进的模糊C均值聚类算法及其应用,O159
- 支持向量机理论及其应用,O212.1
- 集合多标签文本分类研究,TP391.1
- 模糊C均值聚类算法的相关问题研究,TP311.13
- 基于正则化方法的模糊C-均值聚类算法的研究,TP311.13
- 基于支持向量机的胎面胶损耗因子优化,U463.341
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com
|