学位论文 > 优秀研究生学位论文题录展示

GEP及SVM融合的分类技术研究

作 者: 王文栋
导 师: 钟智;元昌安
学 校: 广西师范学院
专 业: 计算机应用技术
关键词: 支持向量机 基因表达式编程 特征选择 参数优化
分类号: TP18
类 型: 硕士论文
年 份: 2010年
下 载: 40次
引 用: 0次
阅 读: 论文下载
 

内容摘要


分类是数据挖掘领域中一个重要的研究点,作为对数据进行分析与研究的一个重要手段深受该领域学者的关注,并被应用到现实社会的各个领域。支持向量机是分类的一项新技术,由Vapnik领导的AT&T实验小组于上世纪九十年代中期提出。它是在统计学习理论的VC维理论与结构风险最小原理的基础上提出的。但是,由于现实分类任务中收集到的数据往往含有冗余和不相关特征,使分类的精度受到了影响。支持向量机作为目前分类的有效工具,同样也需要在分类之前进行数据的预处理,去除冗余特征和不相关特征;此外,目前,支持向量机还在惩罚参数C与核参数的确定上还没理论的方法,使得在实际应用中分类的效果没有得到最优。虽然上述两个问题已有不少学者进行了研究,也取得了有效的成绩,但目前还没有形成公认的方法。本文引入了基因表达式编程(Gene Expression Programming,GEP)作为特征选择和支持向量机参数优化的工具,取得了较好的效果。本文所做主要工作:1、对于特征选择问题,指出遗传算法编码方案的不足,提出了GEP算法的编码方案;在借鉴遗传算法进化策略的基础上,根据GEP编码方案的特点形成新的进化策略。2、对于支持向量机的参数优化问题,在认真分析参数对分类效果影响的前提下,结合GEP参数优化方法,提出了基于GEP的参数优化方案。3、针对上面提出的方法,以乳腺癌数据集为例,将特征选择和参数优化两个步骤联合起来,表明了支持向量机在分类任务中进行特征选择和参数优化的必要性。

全文目录


摘要  4-6
ABSTRACT  6-9
第一章 绪论  9-13
  1.1 研究背景  9-10
  1.2 研究历史与现状  10-11
  1.3 本文所做主要工作  11-12
  1.4 本文内容安排  12-13
第二章 GEP 与 SVM 相关知识介绍  13-21
  2.1 GEP 起源与原理  13-15
  2.2 GEP 的组织结构  15-17
  2.3 SVM 的基本原理  17-20
    2.3.1 当前空间可分的SVM  17-18
    2.3.2 当前空间不可分的SVM  18-20
  2.4 本章小结  20-21
第三章 基于 GEP 的特征选择设计  21-34
  3.1 特征选择简介  21-22
  3.2 特征选择常用方法  22-23
    3.2.1 评价准则  22
    3.2.2 搜索策略  22-23
  3.3 GEP 进行特征选择的方法  23-29
    3.3.1 编码设计  23-25
    3.3.2 遗传操作  25-27
    3.3.3 进化策略  27
    3.3.4 适应度函数  27-28
    3.3.5 算法流程  28-29
  3.4 实验与讨论  29-33
    3.4.1 实验  29-32
    3.4.2 分析与讨论  32-33
  3.5 本章小结  33-34
第四章 基于 GEP 的支持向量机参数优化  34-45
  4.1 影响分类精度的分析  34-36
  4.2 参数选择的常用方法  36-37
    4.2.1 经验法  36
    4.2.2 网格法  36-37
    4.2.3 演化算法  37
  4.3 GEP 优化SVM 参数的方法  37-41
    4.3.1 GEP 优化参数的方案  37-39
    4.3.2 染色体编码方案  39-40
    4.3.3 基因算子  40
    4.3.4 适应度函数  40
    4.3.5 算法参数优化算法  40-41
  4.4 实验  41-44
    4.4.1 实验一  41-43
    4.4.2 实验二  43-44
  4.5 本章小结  44-45
第五章 总结与展望  45-47
  5.1 主要工作总结  45
  5.2 研究展望  45-47
参考文献  47-51
致谢  51-52
附录 A 攻读硕士学位期间所发表的论文  52
附录 B 本文作者攻读硕士学位期间主持和参加的科研项目  52

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于仿生模式识别的文本分类技术研究,TP391.1
  10. 唇读中的特征提取、选择与融合,TP391.41
  11. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  12. 基于图像的路面破损识别,TP391.41
  13. 基于支持向量机的故障诊断方法研究,TP18
  14. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  15. 莴笋渗透脱水传质动力学及渗后热风干燥特性研究,TS255.52
  16. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  17. 语音情感识别的特征选择与特征产生,TP18
  18. 基于车载3D加速传感器的路况监测研究,TP274
  19. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  20. 基于数据分布特征的文本分类研究,TP391.1
  21. 基于机器学习的入侵检测系统研究,TP393.08

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com