学位论文 > 优秀研究生学位论文题录展示
基于聚类核的半监督支持向量机分类方法研究
作 者: 李涛
导 师: 汪西莉
学 校: 陕西师范大学
专 业: 计算机软件与理论
关键词: 半监督学习 支持向量机分类 Bagged聚类核 连通核 层次聚类连通核
分类号: TP181
类 型: 硕士论文
年 份: 2012年
下 载: 4次
引 用: 0次
阅 读: 论文下载
内容摘要
机器学习是一门研究机器获取新知识和新技能,并识别现有知识的学问。通过学习已有的一些观测数据(样本),建立一种模型或学习器,以便于对未知的数据进行分析和预测。随着互联网和科学技术的迅速飞跃,可以很方便的采集大量无标记样本,相对而言,可利用的有标记样本数目十分有限,机器学习中的半监督学习关注的焦点是如何在有标记样本数目有限的情况下结合无标记样本来增强学习器的性能。标准的支持向量机(Support Vector Machine, SVM)分类方法通过对已标记样本进行训练,并结合最大间隔原则得到分类超平面,对于样本数据固有的分布情况及所隐含的信息,并没有考虑,因而在一定程度上影响了该方法对具体模式进行识别的能力。为了进一步提高SVM的分类性能,产生了基于聚类核的半监督支持向量机。基于聚类核的半监督支持向量机在核矩阵的构造过程中,充分利用无标记样本信息,进而提高支持向量机的分类精度。其类型主要包括基于随机游走核和谱聚类核的半监督支持向量机,然而这两种半监督支持向量机方法都需要对标记样本和无标记样本组成的相似度矩阵进行对角化,当无标记样本数目很大时,存储相似度矩阵的空间复杂度和对角化相似度矩阵的时间复杂度都很高。如何更加充分利用无标记样本,增强半监督支持向量机的分类效率值得深入研究。本文的主要工作包括:对基于聚类核的半监督支持向量机分类方法的研究现状进行了阐述,并对聚类核的整体框架做了说明,在此基础上提出了两种基于聚类核的半监督支持向量机分类方法:(1)基于Bagged聚类核的半监督支持向量机分类算法。其思想是:位于同一聚类中的样本应被划分在同一侧,决策面通过的区域样本分布应该稀少。对由少量标记样本和所有无标记样本组成的样本集合采用k均值聚类算法进行多次聚类,得到一种半监督核(Bagged聚类核)。该核能够对样本之间的相似度信息进行重新调整,使得位于同一聚类的样本之间的相似度增大,而被聚到不同类中的样本,它们之间的相似度减小。将Bagged聚类核与用于支持向量机的核函数构造中,得到基于Bagged聚类核的半监督支持向量机,实现利用无标记样本以改善支持向量机的分类性能。(2)基于层次聚类连通核的半监督支持向量机分类算法。为了更加有效的利用标记样本和无标记样本,增强其对任意分布数据的分类性能,提出基于层次聚类连通核的半监督支持向量机分类方法,该算法采用层次聚类的方法并结合连通核的思想去构造层次聚类连通核,使得位于同一线状分布内的数据或形状不规整区域内的数据变得更致密,将其与支持向量机相结合而得到基于层次聚类连通核的半监督支持向量机。实验表明,该方法在分类精度方面优于支持向量机分类方法和基于Bagged聚类核的半监督支持向量机。
|
全文目录
摘要 3-5 Abstract 5-9 第1章 绪论 9-15 1.1 研究背景和意义 9 1.2 分类方法 9-11 1.2.1 贝叶斯分类 10 1.2.2 K近邻分类 10-11 1.2.3 支持向量机分类 11 1.3 半监督支持向量机分类方法的研究现状 11-13 1.4 本文研究内容与组织结构 13-15 1.4.1 本文研究内容 13 1.4.2 本文组织结构 13-15 第2章 基本理论 15-19 2.1 半监督支持向量机 15-16 2.2 半监督核 16-18 2.2.1 半监督图核 16-17 2.2.2 聚类核 17-18 2.3 本章小结 18-19 第3章 基于Bagged聚类核的半监督支持向量机 19-31 3.1 引言 19 3.2 聚类核 19-21 3.2.1 Bagged聚类核的基本思想 20-21 3.2.2 Bagged聚类核的构造过程 21 3.3 基于Bagged聚类核的半监督支持向量机分类方法 21-22 3.5 实验结果与分析 22-30 3.5.1 数据集分类实验 23-25 3.5.2 图像分类实验 25-29 3.5.3 实验结果分析 29-30 3.6 本章小结 30-31 第4章 基于层次聚类连通核的半监督支持向量机 31-43 4.1 引言 31 4.2 连通核 31-33 4.3 层次聚类连通核 33-35 4.4 基于层次聚类连通核的半监督支持向量机分类方法 35-36 4.5 实验结果与分析 36-42 4.5.1 数据集分类实验 36-38 4.5.2 图像分类实验 38-42 4.5.3 实验结果分析 42 4.6 本章小结 42-43 第5章 总结与展望 43-45 5.1 全文总结 43 5.2 展望 43-45 参考文献 45-51 致谢 51-53 攻读硕士学位期间科研成果 53
|
相似论文
- 应用层协议识别和还原方法的研究与实现,TP393.08
- 基于半监督模糊聚类的入侵防御技术研究,TP393.08
- 李群深层结构学习算法研究,TP181
- 基于标记样本和相似度调整的k均值算法在文本聚类中的应用,TP181
- 指纹图像分割方法评价与半监督学习在指纹图像分割中的应用研究,TP391.41
- 基于改进PSO和参数优化的LSSVM的风力发电机齿轮箱故障诊断,TM315
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- 半监督学习方法研究,TP181
- 基于支持向量机的桥梁结构健康监测变形数据的研究,TP274
- 基于在线学习算法的恶意网页检测系统,TP393.092
- 基于机器学习算法的隐喻识别研究,TP181
- 纠错输出编码算法的研究及其应用,TP311.13
- 半监督学习中协同训练与多视图方法的比较及改进,TP18
- 数据挖掘在研究生调剂中的应用研究,TP311.13
- 支持向量机核函数的参数选择方法,TP18
- 基于多知识库电力变压器故障诊断专家系统,TM41
- 基于半监督学习的工况识别方法研究及铜闪速熔炼过程中的应用,TF811
- 基于半监督多示例的径向基函数网络模型及学习算法研究,O242.1
- 基于半监督学习的时间序列分类研究与实现,TP181
- 基于半监督哈希算法的图像检索方法研究,TP391.41
- 基于多分类支持向量机的选股模型研究,F224
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com
|