学位论文 > 优秀研究生学位论文题录展示

基于相容粗糙集的基因微阵列数据分类研究

作 者: 王蓬
导 师: 孟军
学 校: 大连理工大学
专 业: 计算机软件与理论
关键词: 粗糙集 分类 基因微阵列 基因选择
分类号: TP18
类 型: 硕士论文
年 份: 2013年
下 载: 23次
引 用: 0次
阅 读: 论文下载
 

内容摘要


粗糙集理论是一种分析不精确、不一致、不完备数据的有效工具。然而,等价关系约束下的经典粗糙集模型只能应对离散化形式的数据,具有很大的局限性。基于相容关系知识表示的粗糙集模型,可以方便地处理数值类型数据。面对高通量时代基因微阵列数据的处理需求,迫切需要一种可有效地解决高维度、小样本数据的分类方法。利用粗糙集理论对基因微阵列数据进行分类研究已经成为生物信息学领域的又一研究热点。从近似获取方式的不同和邻域获取方式的不同两个角度构建粗糙集模型,提出一种基于向前删除策略的属性约简算法解决基因选择问题。基于集合的方式定义概念的近似,利用相交邻域定义对象的邻域,而非采用传统方法中基于点的近似和距离邻域的获取方式。这使得对确定概念的近似更加准确,并且对象间在每一维都有很大的相似性。在8个数据集上的实验结果表明,针对不同的数据集应该选择不同的粗糙集模型来构建知识,基于集合近似及相交邻域构建的粗糙集模型可适应大多数基因微阵列数据的基因选择。通过查阅已有基因注解和统计对比进一步说明了本文方法的有效性。利用基于规则的分类器实现基因微阵列数据的分类。首先,采用等频率区间法针对上文基因选择后的数据进行离散化。然后,定义知识粒概念,通过值域相邻区间的对象合并策略构建粒的中心集和邻域集,改变以往仅仅基于中心集或邻域集约束的规则提取模式。最后,利用本文给出的规则归纳算法提取规则并构建分类器。实验结果表明,提出的基于双重验证的规则归纳算法,不仅可以提取出错误率低的规则集,而且使得构建的分类器具有更高的准确率。总之,本文成功地利用基于相容关系的粗糙集模型及相关算法解决了基因微阵列数据的分类问题。在动、植物和模拟数据上的实验分析表明,无论是从选择的基因质量还是构建的分类器分类能力来看,效果都得到了一定的提高。

全文目录


摘要  4-5
Abstract  5-8
1 绪论  8-14
  1.1 课题的提出及研究意义  8-10
    1.1.1 生物信息学与基因微阵列  8-9
    1.1.2 基因微阵列数据处理的发展趋势  9-10
    1.1.3 粗糙集在基因微阵列分类中的优势  10
  1.2 课题的研究现状  10-12
    1.2.1 粗糙集理论的研究现状  10-11
    1.2.2 基因微阵列数据分类的研究进展  11-12
  1.3 本文的研究内容及结构安排  12-14
2 相关技术介绍  14-19
  2.1 粗糙集理论简介  14
  2.2 粒计算理论简介  14-15
  2.3 基因微阵列简介  15-18
    2.3.1 基因微阵列的基本理论  15-16
    2.3.2 基因微阵列表达数据  16-17
    2.3.3 基因微阵列数据分析的一般流程  17-18
  2.4 本章小结  18-19
3 Pawlak粗糙集模型及在相容关系下的扩展  19-24
  3.1 Pawlak粗糙集模型基本概念  19-20
  3.2 粗糙集模型中的属性约简和规则提取  20-21
    3.2.1 基于粗糙集的属性约简  20-21
    3.2.2 基于粗糙集的规则提取  21
  3.3 基于相容关系的粗糙集模型NTRS  21-23
  3.4 本章小结  23-24
4 基于NTRS模型的基因选择  24-37
  4.1 基于粗糙集理论的基因选择方法  24
  4.2 相容关系的构建  24-27
  4.3 基于向前删除策略的基因选择方法  27-31
    4.3.1 秩和检测  27-28
    4.3.2 基因选择方法架构  28-29
    4.3.3 基因选择算法GSNTRS  29-31
  4.4 实验验证  31-36
    4.4.1 实验数据集及实验方法  31-32
    4.4.2 实验结果与分析  32-34
    4.4.3 部分基因分析  34-35
    4.4.4 与其它相关工作的比较  35-36
  4.5 本章小结  36-37
5 基于NTRS模型的微阵列数据分类研究  37-52
  5.1 知识粒的构建  37-42
    5.1.1 相容知识库与信息表之间的关系  37-39
    5.1.2 基因微阵列数据的离散化  39-40
    5.1.3 微阵列数据的相容关系构建及知识粒的定义  40-42
  5.2 规则提取方法  42-47
    5.2.1 规则的粒化  42-44
    5.2.2 基于NTRS模型的规则归纳算法RINTRS  44-46
    5.2.3 RINTRS算法运行实例  46-47
  5.3 分类器的构建及评价指标  47-48
  5.4 实验结果及分析  48-51
  5.5 本章小结  51-52
结论  52-53
参考文献  53-57
攻读硕士学位期间发表学术论文情况  57-58
致谢  58-59

相似论文

  1. K公司计划及预测改进对于合理库存配置的研究,F224
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 基于三维重建的焊点质量分类方法研究,TP391.41
  4. 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
  5. 上下文相关的词汇复述研究,TP391.1
  6. 基于仿生模式识别的文本分类技术研究,TP391.1
  7. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  8. 基于图像的路面破损识别,TP391.41
  9. 多样性密度学习算法的研究与应用,TP181
  10. 基于支持向量机的故障诊断方法研究,TP18
  11. 计算智能在数字化卷烟叶组配方中的应用研究,TS44
  12. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  13. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  14. 基于遗传算法和粗糙集的聚类算法研究,TP18
  15. 泥鳅Dmrt1基因的克隆、表达和选择性剪接分析,Q78
  16. 《汉语水平词汇与汉字等级大纲》中的名词教学策略研究,H195
  17. GL电力公司薪酬方案改进设计研究,F426.61
  18. 基于数据分布特征的文本分类研究,TP391.1
  19. 梅尧臣说理诗研究,I207.22
  20. 动力灾害煤炭资源开采危险程度预测方法,TD713
  21. 基于改良蚁群算法的神经网络分类规则提取,TP183

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com