学位论文 > 优秀研究生学位论文题录展示
GEP及SVM融合的分类技术研究
作 者: 王文栋
导 师: 钟智;元昌安
学 校: 广西师范学院
专 业: 计算机应用技术
关键词: 支持向量机 基因表达式编程 特征选择 参数优化
分类号: TP18
类 型: 硕士论文
年 份: 2010年
下 载: 40次
引 用: 0次
阅 读: 论文下载
内容摘要
分类是数据挖掘领域中一个重要的研究点,作为对数据进行分析与研究的一个重要手段深受该领域学者的关注,并被应用到现实社会的各个领域。支持向量机是分类的一项新技术,由Vapnik领导的AT&T实验小组于上世纪九十年代中期提出。它是在统计学习理论的VC维理论与结构风险最小原理的基础上提出的。但是,由于现实分类任务中收集到的数据往往含有冗余和不相关特征,使分类的精度受到了影响。支持向量机作为目前分类的有效工具,同样也需要在分类之前进行数据的预处理,去除冗余特征和不相关特征;此外,目前,支持向量机还在惩罚参数C与核参数的确定上还没理论的方法,使得在实际应用中分类的效果没有得到最优。虽然上述两个问题已有不少学者进行了研究,也取得了有效的成绩,但目前还没有形成公认的方法。本文引入了基因表达式编程(Gene Expression Programming,GEP)作为特征选择和支持向量机参数优化的工具,取得了较好的效果。本文所做主要工作:1、对于特征选择问题,指出遗传算法编码方案的不足,提出了GEP算法的编码方案;在借鉴遗传算法进化策略的基础上,根据GEP编码方案的特点形成新的进化策略。2、对于支持向量机的参数优化问题,在认真分析参数对分类效果影响的前提下,结合GEP参数优化方法,提出了基于GEP的参数优化方案。3、针对上面提出的方法,以乳腺癌数据集为例,将特征选择和参数优化两个步骤联合起来,表明了支持向量机在分类任务中进行特征选择和参数优化的必要性。
|
全文目录
摘要 4-6 ABSTRACT 6-9 第一章 绪论 9-13 1.1 研究背景 9-10 1.2 研究历史与现状 10-11 1.3 本文所做主要工作 11-12 1.4 本文内容安排 12-13 第二章 GEP 与 SVM 相关知识介绍 13-21 2.1 GEP 起源与原理 13-15 2.2 GEP 的组织结构 15-17 2.3 SVM 的基本原理 17-20 2.3.1 当前空间可分的SVM 17-18 2.3.2 当前空间不可分的SVM 18-20 2.4 本章小结 20-21 第三章 基于 GEP 的特征选择设计 21-34 3.1 特征选择简介 21-22 3.2 特征选择常用方法 22-23 3.2.1 评价准则 22 3.2.2 搜索策略 22-23 3.3 GEP 进行特征选择的方法 23-29 3.3.1 编码设计 23-25 3.3.2 遗传操作 25-27 3.3.3 进化策略 27 3.3.4 适应度函数 27-28 3.3.5 算法流程 28-29 3.4 实验与讨论 29-33 3.4.1 实验 29-32 3.4.2 分析与讨论 32-33 3.5 本章小结 33-34 第四章 基于 GEP 的支持向量机参数优化 34-45 4.1 影响分类精度的分析 34-36 4.2 参数选择的常用方法 36-37 4.2.1 经验法 36 4.2.2 网格法 36-37 4.2.3 演化算法 37 4.3 GEP 优化SVM 参数的方法 37-41 4.3.1 GEP 优化参数的方案 37-39 4.3.2 染色体编码方案 39-40 4.3.3 基因算子 40 4.3.4 适应度函数 40 4.3.5 算法参数优化算法 40-41 4.4 实验 41-44 4.4.1 实验一 41-43 4.4.2 实验二 43-44 4.5 本章小结 44-45 第五章 总结与展望 45-47 5.1 主要工作总结 45 5.2 研究展望 45-47 参考文献 47-51 致谢 51-52 附录 A 攻读硕士学位期间所发表的论文 52 附录 B 本文作者攻读硕士学位期间主持和参加的科研项目 52
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 唇读中的特征提取、选择与融合,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 莴笋渗透脱水传质动力学及渗后热风干燥特性研究,TS255.52
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 语音情感识别的特征选择与特征产生,TP18
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于数据分布特征的文本分类研究,TP391.1
- 基于机器学习的入侵检测系统研究,TP393.08
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|