学位论文 > 优秀研究生学位论文题录展示
不平衡数据集上支持向量机算法研究
作 者: 刘维会
导 师: 贺国平
学 校: 山东科技大学
专 业: 基础数学
关键词: 统计学习理论 支持向量机 不平衡数据集 参数选择 梯度下降法
分类号: TP18
类 型: 硕士论文
年 份: 2010年
下 载: 83次
引 用: 0次
阅 读: 论文下载
内容摘要
支持向量机是由Vapnik等人提出的一种新的学习机器,它建立在统计学习理论基础之上,是处理小样本学习的有效工具,在文本自动分类、信号处理、手写数字识别、通讯等领域得到了广泛应用;并克服了传统机器学习中的过学习、维数灾难、局部极值等问题。通常的支持向量机在处理不平衡数据集时,不同类别样本数量上的差异导致分类器性能的下降,而实际应用中,少数类的样本往往提供更重要的信息,因此如何有效地提高不平衡数据集上机器学习的分类性能成为机器学习领域急需解决的课题。本文首先介绍了支持向量机的基本理论以及处理不平衡数据集的支持向量机研究现状。对于两分类问题,正负类训练样本数量的不平衡对分类性能的影响很大,Veropulos等人对传统的SVM进行了改进,提出对不同的类别引入不同的惩罚因子。本文则基于正负类的样本数量,结合支持向量,提出了一种调整分类超平面的方法。该方法有效地提高了正类的预测正确率。寻找支持向量机的最优参数也是支持向量机研究领域的一个重要分支。本文从两个惩罚参数的不平衡数据分类模型出发,在其对偶问题中,把两个惩罚参数也看作核函数的参数,结合最优化方法,分别对L1-SVM和L2-SVM提出了在不平衡数据集上进行参数选择的新方法。
|
全文目录
摘要 5-6 ABSTRACT 6-9 1 绪论 9-14 1.1 研究背景及意义 9-10 1.2 国内外研究现状 10-12 1.3 论文的研究内容和意义 12 1.4 论文的主要安排 12-14 2 支持向量机的基本理论 14-25 2.1 引言 14 2.2 支持向量分类机 14-22 2.3 支持向量分类机解的非唯一性 22-25 3 调整分类超平面的新方法--平均距离比法 25-34 3.1 引言 25 3.2 样本数量对分类性能的影响 25-29 3.3 平均距离比法 29-32 3.4 数值实验 32-34 4 不平衡数据集上SVM参数选择算法 34-45 4.1 引言 34-35 4.2 不平衡数据集上L2-SVM多参数选择方法 35-39 4.3 不平衡数据集上L1-SVM多参数选择方法 39-42 4.4 数值实验 42-45 5 总结与展望 45-47 参考文献 47-51 致谢 51-52 攻读硕士期间主要成果 52
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于机器学习的入侵检测系统研究,TP393.08
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于AdaBoost算法的人脸识别研究,TP391.41
- 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
- 城市污水处理厂中A~2O工艺过程的建模研究,X703
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|