学位论文 > 优秀研究生学位论文题录展示

基于数据分布特征的支撑向量机核选择方法研究

作 者: 郭金玲
导 师: 王文剑
学 校: 山西大学
专 业: 系统工程
关键词: 统计学习理论 支撑向量机 核选择 数据分布 坐标变换核 分类
分类号: TP18
类 型: 硕士论文
年 份: 2007年
下 载: 165次
引 用: 0次
阅 读: 论文下载
 

内容摘要


支撑向量机(Support Vector Machine,SVM)是近年来受到广泛关注的一类学习机器,它以统计学习理论(Statistical Learning Theory,SLT)为基础,具有简洁的数学形式、标准快捷的训练方法和良好的泛化性能,已广泛应用于模式识别、函数估计和时间序列预测等数据挖掘问题。目前SVM的研究热点主要有:SVM的模型选择、快速学习算法研究等。由于支撑向量机是一种基于核的学习方法,所以核及相关参数的选取对泛化能力有着重要的影响,进而对支撑向量机的性能也有着重要的影响。如何有效地进行核及相关参数的选择是支撑向量机研究领域的一个重要问题。本文对于SVM的核及相关参数的选择问题进行了系统研究,主要内容如下:(1)对现有的核函数及核选择方法进行了详细的分析和研究。(2)给出了四种测试训练集几何分布的算法。本文利用分类问题的几何意义直接从数据集出发,按照两类样本点之间的距离关系,分别给出SVM训练集呈圆形、环形、球状、柱状分布的测试算法,为基于数据分布的核选择方法提供了实现的基础。(3)提出了基于数据分布的核函数及参数选择方法。目前大多数核选择方法都不考虑数据的分布特征,没有充分利用隐含在数据中的信息。如果已知数据的分布特征或可得到其数据分布特征的近似,在此基础上,再进行SVM核函数及其参数的选择,则可提高SVM的泛化能力。本文在确定训练数据集几何分布的基础上,从给定的核函数集中选择一种最恰当的核函数,应用到支撑向量机上,以期获得最优的性能。(4)给出了数据呈某种分布时分类效果最佳的核函数选择方法。论文分别选取了坐标变换核、高斯核和多项式核函数作为研究对象,在人工数据集和真实数据集上进行了测试,验证了本文所提出方法的可行性和有效性。本文研究的内容是SVM研究中的热点问题之一,研究结果不仅具有重要的理论意义,而且对于实际问题具有直接的应用价值。

全文目录


摘要  8-9
ABSTRACT  9-11
第一章 引言  11-15
  1.1 研究背景  11-13
  1.2 国内外研究现状  13-14
  1.3 论文的主要工作  14-15
第二章 统计学习理论支撑向量机  15-23
  2.1 统计学习理论  15-18
    2.1.1 学习问题的一般表示  15-16
    2.1.2 学习机器泛化能力的界  16-18
  2.2 SVM简介  18-22
    2.2.1 线性硬间隔SVM  19-20
    2.2.2 线性软间隔SVM  20-21
    2.2.3 核映射  21-22
  2.3 本章小结  22-23
第三章 现有核函数及核选择方法的分析与研究  23-29
  3.1 几种常用核函数的性能分析  23-24
    3.1.1 多项式核函数  23
    3.1.2 高斯核函数  23
    3.1.3 坐标变换核  23-24
  3.2 核函数选择方法  24-27
    3.2.1 目前核选择方法分析  24-25
    3.2.2 留一法分析  25-27
  3.3 本章小结  27-29
第四章 基于数据分布的核函数选择方法  29-41
  4.1 高维数据降维算法  29-31
    4.1.1 主成分分析方法  29-30
    4.1.2 多维尺度分析方法  30-31
  4.2 数据分布判定算法  31-37
    4.2.1 圆形分布判定算法  31-32
    4.2.2 环形分布判定算法  32-34
    4.2.3 球形分布判定算法  34-35
    4.2.4 柱状分布判定算法  35-37
  4.3 基于数据分布的核函数选择方法的实现  37-40
  4.4 本章小结  40-41
第五章 数值实验  41-55
  5.1 人工数据集实验  41-48
    5.1.1 在人工数据集S1上的实验结果及分析  42-44
    5.1.2 在人工数据集S2上的实验结果及分析  44-45
    5.1.3 在人工数据集S3上的实验结果及分析  45
    5.1.4 在人工数据集S4上的实验结果及分析  45-47
    5.1.5 在人工数据集S5上的实验结果及分析  47-48
  5.2 真实数据集实验  48-54
    5.2.1 在真实数据集D1上的实验结果及分析  48-50
    5.2.2 在真实数据集D2上的实验结果及分析  50-52
    5.2.3 在真实数据集D3上的实验结果及分析  52-54
  5.3 本章小结  54-55
第六章 结论和展望  55-56
参考文献  56-60
致谢  60-61
附录  61-62

相似论文

  1. K公司计划及预测改进对于合理库存配置的研究,F224
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 基于三维重建的焊点质量分类方法研究,TP391.41
  4. 基于串核的蛋白质分类算法的研究与实现,TP301.6
  5. 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
  6. 上下文相关的词汇复述研究,TP391.1
  7. 基于仿生模式识别的文本分类技术研究,TP391.1
  8. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 多样性密度学习算法的研究与应用,TP181
  12. 运动特征及地形约束的感知网目标跟踪算法及系统研究,TP212.9
  13. 计算智能在数字化卷烟叶组配方中的应用研究,TS44
  14. 基于中国土壤系统分类的土壤类型和界线确定研究,S155
  15. 弯孢属种分子鉴定体系的建立及其在疑难种上的应用,Q949.32
  16. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  17. 面向公众的教育视频共建共享平台的设计与实践研究,G434
  18. 基于土壤系统分类的土壤调查方法研究,S155
  19. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  20. 基于HJ卫星混合像元分解的水稻生长监测技术研究,S511
  21. 基于连锁图的QTL综合分析方法研究,S562

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com