学位论文 > 优秀研究生学位论文题录展示

基于稀疏局部敏感法则的微阵列数据分析

作 者: 王明霞
导 师: 戴道清
学 校: 中山大学
专 业: 信息计算科学
关键词: 稀疏 局部敏感 特征提取 癌症分类 致病基因寻找
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 34次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着时代的进步,基因功能研究逐渐超越基因序列研究,成为后基因组时代研究的重点;并且微阵列技术使研究人员可以同时测定成千上万个基因的表达水平,这为生物标志物的检测以及癌症诊断提供了重要的技术支持。然而基因表达数据的高维数、高噪声的特点对分析方法提出了更高的要求。如何在海量基因表达数据中,发现肿瘤组织的基因表达模式,并成功地将临床表征不明或容易误诊的恶性肿瘤准确、快速地区分开,是一项具有挑战性的研究课题。近年来,多种判别分析和变量选择的方法用于基因表达数据的分析。于是生物标志物的检测–从成千上万个基因当中检测出那些与肿瘤起因、发展紧密相关的关键基因的方法逐渐增加,这使得癌症的诊断更准确且更容易解释。本文围绕运用局部敏感半监督特征选择方法和稀疏惩罚实现变量选择方法,及其在基于基因表达数据进行生物标志物检测以及癌症诊断的应用而展开。本文受到局部敏感半监督特征选择、局部敏感判别分析以及稀疏PCA的启发,将局部敏感和稀疏方法结合起来提出一种新的判别方法–稀疏局部敏感法则。这样,一方面利用局部敏感算法的优势,即在处理小样本问题时,能够提取更多局部的结构信息而不单单是全局的判别信息,最终使得同类样本足够接近,不同类样本尽量分离,以便取得良好的癌症分类效果;另一方面,利用弹性网的解的稀疏性,使得提取的最佳分类特征仅仅是少数原始变量的线性组合,这种方法应用在基于基因表达数据分析中,具有很好的生物解释意义,为寻找致病基因提供重要依据。

全文目录


摘要  3-5
ABSTRACT  5-8
第1章 引言  8-14
  1.1 研究背景和意义  8-9
  1.2 特征提取技术及研究现状  9-11
  1.3 本文的主要工作  11-14
第2章 准备知识  14-23
  2.1 稀疏化  14-16
  2.2 几种局部保持算法介绍  16-23
第3章 稀疏局部敏感法则  23-35
  3.1 矩阵的构造  23-26
  3.2 稀疏局部敏感法则算法基本思想  26-34
  3.3 稀疏局部敏感法则的算法过程  34-35
第4章 实验及结果分析  35-48
  4.1 数据集的描述与预处理方法  35-36
  4.2 参数的解释与选择  36-37
  4.3 实验结果  37-45
  4.4 总结与展望  45-48
参考文献  48-52
致谢  52-53

相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 大规模稀疏关系数据索引技术研究,TP311.132.3
  4. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  5. Q学习在基于内容图像检索技术中的应用,TP391.41
  6. 图像的稀疏表示及编码模型研究,TP391.41
  7. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  8. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  9. 空间交会接近视觉测量方法研究,TP391.41
  10. 图像实时采集、存储与处理方法研究,TP391.41
  11. 唇读中的特征提取、选择与融合,TP391.41
  12. 多币种纸币处理技术的研究与实现,TP391.41
  13. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  14. 基于图像的路面破损识别,TP391.41
  15. 移动机器人视觉检测和跟踪研究,TP242.62
  16. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  17. 基于随机森林的植物抗性基因识别方法研究,Q943
  18. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  19. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  20. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  21. 红外图像目标识别及跟踪技术研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com