学位论文 > 优秀研究生学位论文题录展示
基于支持向量机与k-means混合分类模型的多光谱遥感影像分类研究
作 者: 刘丹
导 师: 陈剑鸣
学 校: 昆明理工大学
专 业: 物理电子学
关键词: SVM k-means 混合模型 分类 参数优化 核函数 多光谱遥感
分类号: TP181
类 型: 硕士论文
年 份: 2013年
下 载: 2次
引 用: 0次
阅 读: 论文下载
内容摘要
随着遥感数据获取技术的快速发展,数据源的多样性远远超前于数据的处理水平。因此,关于遥感数据处理与分析方法的研究对推动遥感数据应用具有重要的意义。其中,多光谱遥感数据的分类就是一个具有挑战性的研究方向之一。支持向量机(Support Vector Machine, SVM),作为统计学习理论最有效的方法之一,克服了传统方法中的过学习、非线性、维数灾难以及局部极小等问题,成为了多光谱遥感影像分类算法中的一个研究热点。SVM是一种机器学习算法,用于多光谱遥感影像的分类已经有二十年的历史。k-means聚类算法作为一种经典的聚类算法,也被用于对各种数据进行分类。通过阅读大量的文章发现,这两种算法均具有各自独特的优势与不足。因此,为了满足多光谱遥感影像分类后的应用需求,这两种算法的分类性能都具有一定的提升空间。由于SVM算法属于监督分类方法,分类前需要人工选取(标注)的训练样本来建立分类模型。然而,k-means聚类算法属于非监督分类方法,无需训练样本就可以自动对未知样本进行聚类。因此,这两种分类算法,在原理上具有很大的互补性。为进一步提高分类精度,本文提出了一种SVM与k-means联合工作的多光谱遥感影像混合分类模型。本文完成了该模型的数学推导,并将此策略成功地应用到了Landsat TM多光谱遥感影像数据的分类中。该混合模型的工作原理是:首先采用k-means对未知数据进行聚类,然后从各类的聚类中心周围一定半径内自动选取训练样本,作为SVM的训练数据。实验表明,通过人工标注的样本建立的SVM模型的分类精度为89.47%,而混合分类模型分类精度为97.53%。显然,混合模型的分类精度得到了显著的提高,从而有力地证明了该方法的有效性。在课题研究过程中,详细分析了“混合模型”所涉及到的一系列理论与实践问题。包括:高维数据与低维数据对不同核函数(Kernel)的适应问题、SVM的参数寻优算法(三种优化算法)的选取问题、SVM变形算法(C-SVM、v-SVM及LS-SVM)的分类性能、二次规划问题的求解等。此外,本文还重点研究了核参数γ及惩罚因子C对RBF核函数下SVM分类器性能的影响。围绕本课题的目标,本文进行了五个方面的研究,采用了十六个实验来验证本文所涉及的一系列理论问题。通过对实验的结果分析,获取了重要的实验数据和结论,极大地丰富了理论研究的内容。这些研究内容为进一步的理论研究提供了有力的支撑,为本文提出的“SVM与K-means多光谱遥感影像混合模型分类模型”奠定了不可或缺的基础。
|
全文目录
摘要 4-6 Abstract 6-8 目录 8-13 图目录 13-15 表目录 15-17 第一章 绪论 17-33 1.1 课题研究的背景、意义及目标 17-20 1.1.1 课题研究背景及意义 17-19 1.1.2 课题研究的总体目标 19-20 1.2 国内外研究的现状 20-25 1.2.1 机器学习研究现状 20 1.2.2 遥感影像分类方法的国内外研究现状 20-25 1.3 研究内容及需要探讨的关键理论问题 25-26 1.3.1 研究内容 25-26 1.3.2 需探究的关键理论与算法问题 26 1.4 实验安排和实验数据 26-30 1.4.1 实验安排 26-30 1.4.2 实验数据 30 1.5 论文结构和安排 30-33 第二章 支持向量机的基本原理 33-53 2.1 统计学习理论 33-36 2.1.1 函数集的VC维 33-35 2.1.2 推广性的界 35-36 2.2 支持向量机的基本思想 36-44 2.2.1 最优分类超平面与线性分类器 36-40 2.2.2 非线性可分分类器 40-42 2.2.3 核函数及核条件 42-44 2.3 最优化理论 44-47 2.3.1 KKT条件 45-46 2.3.2 lagrange对偶(Dual form)问题 46-47 2.3.3 Wolfe对偶(Dual form)问题 47 2.4 支持向量机的训练(Training)算法 47-51 2.4.1 SVM训练中的分解算法 47-49 2.4.2 序贯最小优化法(SMO)算法 49-51 2.5 本章小结 51-53 第三章 支持向量机理论与模型的进一步探讨 53-67 3.1 支持向量机的变形算法 53-56 3.1.1 C-SVM算法 53-54 3.1.2 v-SVM算法 54 3.1.3 One-class SVM算法 54-55 3.1.4 LS-SVM算法 55-56 3.2 SVM的多分类算法 56-63 3.2.1 One-Against-Rest方法 56-57 3.2.2 One-Against-One方法 57-58 3.2.3 基于二叉树的多分类方法 58-59 3.2.4 纠错编码分类方法 59-62 3.2.4.1 纠错编码算法 59-61 3.2.4.2 汉明距离解码器 61-62 3.2.5 有向无环图(DDAG)方法 62-63 3.3 SVM模型中的参数优化方法 63-66 3.3.1 网格搜索算法 64 3.3.2 粒子群优化算法 64-65 3.3.3 遗传算法 65-66 3.3.4 交叉验证思想 66 3.4 本章小结 66-67 第四章 聚类算法及其应用 67-77 4.1 模式相似测度 67-69 4.1.1 距离测度(Distance Measure) 67-69 4.1.2 相似测度(Similarity Measures) 69 4.2 基于划分的聚类方法 69-73 4.2.1 k-means算法 69-72 4.2.2 k-medoids算法 72-73 4.3 实验一:k-means分类及样本标注实验 73-76 4.3.1 k-means聚类算法对iris(鸢尾属植物)数据的分类实验 73-75 4.3.2 改进的k-means算法对样本标注实验 75-76 4.4 本章小结 76-77 第五章 SVM分类模型中的核函数及参数优化实验 77-97 5.1 针对低维数据的三种核函数分类的比较实验 77-82 5.1.1 实验二:针对iris数据的三种核函数的SVM分类比较实验 77-80 5.1.2 实验三:针对Wine数据集三种核函数的SVM分类比较实验 80-82 5.2 实验四:针对高维数据的三种核函数SVM分类比较实验 82-83 5.3 参数优化实验 83-95 5.3.0 Landsat7ETM+数据 83-84 5.3.1 实验五:交叉验证法网格搜索SVM分类核函数参数寻优实验 84-89 5.3.2 实验六:粒子群优化算法SVM分类核函数参数优化实验 89-91 5.3.3 实验七:遗传算法参数优化实验 91-95 5.4 本章小结 95-97 第六章 不同的SVM模型对遥感影像的分类 97-109 6.1 实验平台及数据 97-100 6.1.1 实验区选择 97-98 6.1.2 实验平台 98-100 6.2 SVM变形算法对洱海LandsatTM影像的分类 100-107 6.2.1 实验八:C-SVM算法对洱海的实验 100-101 6.2.2 实验九:v-SVM算法对洱海的实验 101-103 6.2.3 实验十:LS-SVM算法对洱海的实验 103-107 6.2.3.1 实验十一:规范参数γ对LS-SVM分类器性能的影响实验 106 6.2.3.2 实验十二:RBF核参数σ对LS-SVM分类器性能的影响实验 106-107 6.3 本章小结 107-109 第七章 k-means与SVM混合模型多光谱遥感影像分类 109-137 7.1 Landsat TM影像数据及分类过程 109-115 7.1.1 遥感影像的特征提取 111-112 7.1.2 分类器的选择 112 7.1.3 遥感影像分类精度评估方法 112-115 7.1.3.1 混淆矩阵 113-114 7.1.3.2 Kappa系数 114-115 7.2 Landsat TM影像分类实验平台 115 7.3 Landsat TM影像分类实验 115-135 7.3.1 研究地区概况及样本选择 115-119 7.3.2 实验十三:目视标注样本的Landsat TM数据分类实验 119-124 7.3.3 k-means标注样本的分类实验 124-135 7.3.3.1 实验十四:聚类中心(位置)对分类精度的影响实验 124-127 7.3.3.2 实验十五:特征维数对分类精度的影响实验 127-129 7.3.3.3 实验十六:改进的k-means与SVM的混合分类模型的分类实验 129-135 7.4 本章小结 135-137 第八章 主要工作、结论与讨论 137-145 8.1 论文的主要研究工作 137-138 8.2 结论与讨论 138-142 8.3 论文的特色及创新点 142-143 8.4 进一步的工作设想 143-145 致谢 145-147 参考文献 147-158 附录 攻读硕士期间发表的论文目录 158
|
相似论文
- K公司计划及预测改进对于合理库存配置的研究,F224
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 地波辐射源的调制类型识别与参数估计,TN957.51
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 基于词义及语义分析的问答技术研究,TP391.1
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 基于串核的蛋白质分类算法的研究与实现,TP301.6
- 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
- 上下文相关的词汇复述研究,TP391.1
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 互联网上旅游评论的情感分析及其有用性研究,TP391.1
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 多样性密度学习算法的研究与应用,TP181
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 莴笋渗透脱水传质动力学及渗后热风干燥特性研究,TS255.52
- 计算智能在数字化卷烟叶组配方中的应用研究,TS44
- 基于中国土壤系统分类的土壤类型和界线确定研究,S155
- 弯孢属种分子鉴定体系的建立及其在疑难种上的应用,Q949.32
- 基于SVM分类算法的主题爬虫研究,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com
|