学位论文 > 优秀研究生学位论文题录展示
面向应用领域的分类方法研究
作 者: 李宏
导 师: 陈松乔
学 校: 中南大学
专 业: 计算机应用技术
关键词: 特征基因选取 闭合模式分类器 多值多类标决策树 颜色迁移 事件区域检测
分类号: TP18
类 型: 博士论文
年 份: 2007年
下 载: 406次
引 用: 1次
阅 读: 论文下载
内容摘要
随着计算机技术的飞速发展,很多领域对分类方法提出了新的要求。如在生物信息学方面,人们通过DNA微阵列芯片实验可以得到基因表达谱数据,由于其数据高维的特点,如何从基因表达谱数据中选取包含样本分类信息的特征基因,建立合适分类器,是当前生物信息学研究的重要领域;在图象颜色迁移方面,如何进行多值多类标分类并进行多源图像颜色迁移是新的研究课题;在无线传感器领域中,针对事件检测和传感器的特点,如何建立分布式分类检测算法,对分类器提出了新要求。针对这些问题,本文重点研究了若干分类算法,主要工作和成果表现在以下方面:1.针对基因表达谱的特征基因选取问题进行了研究,提出了综合性分类信息指标—GB指标,将Gini指数与类加权Bhattacharyya距离相结合进行无关基因及噪声数据的剔除;采用欧氏距离丢弃高相关性的冗余基因;运用搜索算法得到最终的特征子集。针对两类急性白血病数据集最终提取了2组包含4个特征基因的子集;针对四类小圆蓝细胞数据集最终提取了1组包含7个特征基因的子集。使用支持向量机和神经网络作为分类器对这些特征基因子集进行分类测试,留一交叉检验和独立测试正确识别率都达到100%,本文提取的特征基因子集更精简,优于目前已发表的同类结果。2.将分类与关联规则挖掘相结合建立基于闭合模式的分类器。基因的表达值代表的是基因的三种表达状态:上升、下降和不变。由于基于关联规则的经典算法CBA等是挖掘所有频繁项目集,对高维基因表达谱进行频繁项集挖掘时,有相当多的模式是冗余的或价值不大的,采用基于闭合模式的分类算法是解决基因表达谱分类途径之一。本文提出了一种基于闭合模式的多类别分类算法DMAC。针对基因表达数据集的特点采用行枚举思想,通过对行集建立行FP-tree,构造路径枚举树的路径枚举PEA算法来挖掘闭合模式。提出了权重算法QZ,通过构造权重函数,对分类器无法识别的样本用权重进行判断,改进了二类分类器的性能。在对四类数据集的测试中取得了好的实验结果。算法有效地解决了基于关联规则的多类分类问题。3.本文对处理多属性多类标数据决策树算法MMC和MMDT机制进行了研究分析,提出了新的相似度公式sim3。由于sim3综合考虑了类标集的相似度和行为一致性,在此基础上构建的决策树算法SCC_SP与MMC及MMDT相比有更好的性能。针对图像颜色迁移问题,研究了二种单源图像颜色迁移算法,在此基础上提出了一种基于多类标决策树的多源图像颜色迁移算法。以多幅源图像中的图像块作为训练样本,提取其颜色、纹理特征以及类标集,建立基于多源图像的多类标决策树;利用多类标决策树对目标图像各图像块进行分类决策,从而实现对目标图像的颜色迁移,其方法弥补了单源图像迁移参考信息不足的缺点,为多源颜色迁移提供了新的借鉴和参考。4.针对无线传感器网络事件区域检测问题,本文提出一种分布式加权容错分类检测算法。针对无线传感器网络的特点,考虑“邻域的邻域”的容错范围,首先通过邻域节点与其周围节点的信息交换,对邻域节点的状态值进行估计,然后采用加权方法对邻域节点的估计状态值进行加权综合,完成对中心节点的错误检测和分类处理。仿真结果表明,该算法在传感器网络初始错误率达到20%的情况下,仍能够检测和纠正90%以上的错误。相比其他算法,该算法具有较高的错误检测精度,改善了事件发生区域边界节点的纠错性能,且算法运行时整个网络所消耗的能量适中。
|
全文目录
摘要 5-7 ABSTRACT 7-10 目录 10-12 插图索引 12-14 表格索引 14-15 第一章 绪论 15-29 1.1 研究背景与意义 15-18 1.2 研究现状 18-26 1.2.1 相关技术的研究现状 18-23 1.2.2 相关领域的研究现状 23-26 1.3 论文研究目标和内容 26-27 1.4 论文结构 27-29 第二章 基因表达谱特征基因的选取方法 29-48 2.1 基因表达谱概述 29-33 2.1.1 基因表达的基本概念 29-30 2.1.2 基因表达水平的检测 30 2.1.3 基因表达谱数据的获取 30-31 2.1.4 数据来源 31-33 2.2 特征基因选择问题提出 33-35 2.2.1 问题提出 33 2.2.2 相关工作 33-35 2.3 基于GB指标的基因表达谱分类特征基因提取 35-43 2.3.1 基本思想 35-36 2.3.2 GB指标的构建 36-39 2.3.3 分类器的构建 39-40 2.3.4 冗余基因去除 40-42 2.3.5 搜索算法 42-43 2.4 实验结果分析 43-47 2.5 本章小结 47-48 第三章 高维多类数据中基于闭合模式的分类算法 48-66 3.1 关联规则的挖掘 48-51 3.1.1 关联规则的基本概念 48-49 3.1.2 关联规则的挖掘算法 49-51 3.2 基于关联规则的分类方法 51-53 3.3 基本思想 53-54 3.4 频繁闭合模式挖掘 54-60 3.4.1 行枚举方法 55-57 3.4.2 PEA算法 57-60 3.5 分类器的构建 60-61 3.6 实验结果 61-65 3.6.1 实验数据 61-62 3.6.2 算法性能分析 62-65 3.7 本章小结 65-66 第四章 多值属性多类标数据决策树算法及其应用 66-93 4.1 问题描述 66-68 4.1.1 引言 66-67 4.1.2 问题描述 67-68 4.2 基本思想 68-70 4.3 SSC_SP算法 70-76 4.3.1 相似度的公式 70-71 4.3.2 属性分类效果的评定 71-73 4.3.3 预测准确率的评定 73 4.3.4 实验结果及分析 73-76 4.4 单源图像的颜色迁移 76-85 4.4.1 引言 76-77 4.4.2 基于直方图映射和分层迁移的灰度图像上色算法 77-81 4.4.3 基于高斯混合模型的区域颜色迁移算法 81-85 4.5 基于多类标决策树的多源图像迁移 85-92 4.5.1 基本思路 86 4.5.2 建立多源图像的多类标决策树 86-89 4.5.3 目标图像类标预测及色彩迁移 89-90 4.5.4 实验结果分析 90-92 4.6 本章小结 92-93 第五章 无线传感器网络事件区域检测分类算法研究 93-108 5.1 引言 93-94 5.2 事件区域检测模型的建立 94-95 5.3 分布式加权容错分类算法 95-97 5.3.1 “邻域的邻域”双重检测 95-96 5.3.2 加权容错机制 96-97 5.4 算法分析 97-100 5.5 仿真实验过程及结果分析 100-107 5.5.1 仿真实验一 100-104 5.5.2 仿真实验二 104-106 5.5.3 能耗分析 106-107 5.6 本章小结 107-108 第六章 总结与展望 108-111 6.1 总结 108-109 6.2 展望 109-111 参考文献 111-121 致谢 121-122 攻博期间参与科研项目及发表论文情况 122-123
|
相似论文
- 褪色图像的色彩修复技术研究,TP391.41
- 基于基因表达数据的胃癌特征基因选取研究,R735.2
- 图像颜色迁移技术的研究,TP391.41
- 基于场景变换和颜色迁移的图像修复,TP391.41
- 基于直方图分层映射的图像增强算法研究,TP391.41
- 图像颜色迁移问题研究,O175.2
- 古建筑虚拟色彩修复及漫游技术研究,TP391.41
- 基于基因表达谱的肿瘤分类特征基因选择研究,R73-3
- 基于视觉感知的图像处理方法研究,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
- 基于遗传—牛顿算法的公交优化调度,TP18
- 基于变异粒子群的聚类算法研究,TP18
- 语音情感识别的特征选择与特征产生,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于知识推理的交叉销售系统的设计与实现,TP18
- 基于粗糙集的城市区域交通绿时控制系统研究,TP18
- 基于免疫机制蚁群算法的电力系统无功优化研究,TP18
- 人工智能的哲学思考,TP18
- 微粒群算法的改进与应用研究,TP18
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|