学位论文 > 优秀研究生学位论文题录展示
基于两类和三类支持向量机的快速多标签分类算法
作 者: 万书鹏
导 师: 许建华
学 校: 南京师范大学
专 业: 计算机应用
关键词: 多标签分类 支持向量机 “一对一”分解策略 快速算法
分类号: TP301.6
类 型: 硕士论文
年 份: 2008年
下 载: 336次
引 用: 0次
阅 读: 论文下载
内容摘要
分类问题是指通过对已知类别的样本集的学习,来预测未知类别样本的问题。对于分类问题,按样本集合中总的类别个数可分为两类分类问题和多类分类问题:按样本所拥有的标签数可分为单标签分类问题和多标签分类问题。其中多标签分类问题是指一个样本同时属于多个类别或者具有多个标签的问题,是最为复杂的分类问题之一,它包括了两类分类问题和多类分类问题。对于多标签分类问题,本文使用一种“一对一”的分解策略,将多标签分类问题分解成多个两类单标签和两类双标签的分类子问题,再分别加以处理。对于两类单标签分类子问题,使用一般的两类支持向量机分类算法进行处理,对于两类双标签分类子问题,本文提出一个基于三类支持向量机的分类算法进行处理,在算法中将同时拥有两个标签的样本看作为在正类和负类之间的混合类的样本,并使用两个平行的超平面将这三个类别的样本分开。为了提高训练速度,文中设计了针对三类支持向量机的快速算法,它是通过将大规模的二次规划问题分解成一系列的小规模的问题来完成的,并且采用对著名的SVMlight算法的修改来实现。在算法的实验部分,本文归纳了一些常用的多标签分类算法的评价准则,并在三个基准数据集酵母数据集、景象数据集和文本数据集上进行实验,与一些存在的多标签分类算法进行比较,以验证算法的性能和速度。在分类性能的比较上,没有一个多标签分类算法能够保证在所有的评价准则上都取得最优,因此本文为实验中算法的每个评价准则打分,然后比较各个算法的总得分,在与Rank-SVM、BoosTexter、AdtBoost.MH、ML-kNN、BP-MLL、BasicBP、OVR-SVM、OVO2BN-SVM、OVOC4.5、OVO-kNN和OVO-NB等众多多标签分类算法的比较中本文的算法在所有进行的实验中总得分排名都不低于第四位。在算法计算时间的比较上,对于具有23149个训练样本的文本数据集,本文的多标签分类算法比其它两种基于支持向量机的分解算法,在训练时间上要快三倍左右,在能够决定测试时间的支持向量个数上也最少。
|
全文目录
摘要 6-7 ABSTRACT 7-9 前言 9-11 第一章 绪论 11-20 1.1 模式识别 11-13 1.1.1 模式识别的方法 11-12 1.1.2 模式识别的应用 12-13 1.2 多标签分类算法的研究现状 13-20 1.2.1 基于数据集分解的多标签方法 14-17 1.2.2 基于单个优化问题的多标签方法 17-20 第二章 支持向量机 20-31 2.1 统计学习理论 20-22 2.1.1 结构风险最小化原则 20-21 2.1.2 VC维简介 21-22 2.1.3 推广性的界 22 2.2 支持向量机的原理 22-25 2.2.1 结构风险最小化原则的体现 22-23 2.2.2 从几何上来解释 23-25 2.3 支持向量机的数学形式 25-27 2.3.1 线性分类的情况 25-26 2.3.2 高维空间的情况 26-27 2.4 支持向量机的快速算法 27-31 2.4.1 分块算法 28-29 2.4.2 分解算法 29 2.4.3 SMO算法 29-31 第三章 基于两类和三类SVM的多标签算法 31-41 3.1 三类支持向量机的基本原理 31-35 3.2 三类支持向量机的快速实现算法 35-37 3.3 基于两类和三类支持向量机的多标签算法 37-41 第四章 实验结果与分析 41-55 4.1 多标签算法性能的评价准则 41-43 4.2 实验数据集与实验算法 43-45 4.2.1 实验数据集简介 43-44 4.2.2 实验算法简介 44-45 4.3 分类性能的比较 45-51 4.3.1 酵母数据集的实验结果 45-49 4.3.2 景象数据集的实验结果 49-50 4.3.3 文本数据集的实验结果 50-51 4.4 算法计算时间的比较 51-55 第五章 总结 55-56 参考文献 56-59 致谢 59-60 已发表文章 60
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于机器学习的入侵检测系统研究,TP393.08
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于AdaBoost算法的人脸识别研究,TP391.41
- 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
- 城市污水处理厂中A~2O工艺过程的建模研究,X703
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法 > 算法理论
© 2012 www.xueweilunwen.com
|