学位论文 > 优秀研究生学位论文题录展示
基于流形学习的肿瘤基因表达数据分类研究
作 者: 吴风玲
导 师: 郑春厚
学 校: 曲阜师范大学
专 业: 控制理论与控制工程
关键词: 流形学习 特征提取 LDA PCA PLS SLLE CMVM 子空间 跨平台 基因表达谱数据 LLDE
分类号: R730.4
类 型: 硕士论文
年 份: 2010年
下 载: 61次
引 用: 0次
阅 读: 论文下载
内容摘要
肿瘤是影响人类健康的主要疾病之一,然而目前的肿瘤诊断方法和治疗效果都不是很理想。基于基因表达谱的肿瘤分子诊断方法是一种全新的快速而准确的诊断方法,它还能检测肿瘤的进展、恶化程度以及抗癌药物的耐药性等,为临床医生诊断肿瘤分型、提供治疗方案以及分析预后提供一种重要参考。目前,具有“高维,小样本”特征的微阵列数据不断积累,如何有效地从这些高维数据中获取有用信息或规律已成为当今信息科学与技术所亟待解决问题之一。从基因表达谱的成千上万个基因中选择分类能力强,数量少的特征基因极具复杂性。通常情况下,在如此大的基因空间中进行穷尽搜索是不可能的。因此选择合适的特征提取方法是非常重要的。本论文中,我们在总结流形学习算法成果的基础上,我们应用一种新的特征提取方法和一些流形学习算法对两类和多类分类问题进行了研究比较,最后我们利用CMVM(Constrained Maximum Variance Mapping, CMVM)和局部线性判别嵌入算法(locally linear discriminant embedding, LLDE)算法对跨平台肿瘤数据进行了分类比较研究。本文主要作了以下研究工作:第一,把一种肿瘤基因表达数据特征提取方法——基于约束最大差异投影的特征提取方法(Constrained Maximum Variance Mapping:CMVM)应用于肿瘤样本基因特征提取,然后我们用K-NN分类器进行分类:在两类分类实验中,我们对前列腺癌数据集和乳腺癌数据集进行了特征提取及识别率的分析;在多类分类实验中,我们对白血病数据集和中枢神经系统肿瘤数据集进行了特征提取及识别率的分析。通过对不同的肿瘤样本基因特征提取及识别率的分析实验验证了该方法的可行性和有效性。第二,把流形学习算法用于跨平台肿瘤样本基因表达数据的特征提取,然后用K-NN分类器进行分类,从而比较它们的识别效果。本文最后指出了目前肿瘤基因表达数据特征提取及分类研究存在的一些问题以及今后需进一步开展的研究工作。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-16 1.1 课题研究的意义 9-10 1.2 DNA微阵列技术 10-12 1.3 DNA微阵列数据分析现状 12-14 1.4 本文的内容安排与创新点 14-16 第2章 流形学习 16-23 2.1 模式识别基本步骤 16-17 2.2 流形学习算法 17-18 2.3 流形学习方法的应用 18-19 2.4 几种代表性的流形学习算法 19-23 2.4.1 等度规映射方法(ISOMAP) 19-20 2.4.2 局部线性嵌入(LLE) 20 2.4.3 拉普拉斯特征谱(LE) 20 2.4.4 Hessian特征映射(HE) 20-21 2.4.5 局部切空间排列(LTSA) 21-22 2.4.6 最大差投影(MVU) 22 2.4.7 Riemann流形学习(RML) 22-23 第3章 基于CMVM特征提取方法的肿瘤样本分类 23-37 3.1 引言 23-24 3.2 基因表达数据的流形分布 24-25 3.3 约束最大差异投影(CMVM)算法 25-28 3.3.1 局部结构 25-26 3.3.2 流形之间的非相似性 26 3.3.3 CMVM算法的目的 26 3.3.4 调整 26-27 3.3.5 核扩展 27-28 3.4 实验结果 28-36 3.4.1 两类分类实验 29-32 3.4.2 多类分类实验 32-35 3.4.3 讨论 35-36 3.5 本章小结 36-37 第4章 LLDE与CMVM的跨平台肿瘤样本分类比较研究 37-48 4.1 引言 37-38 4.2 局部线性判别嵌入(LLDE)算法 38-44 4.2.1 LLDE算法的目的 38-40 4.2.2 LLDE算法 40-44 4.3 约束最大差异投影(CMVM)算法 44-45 4.4 实验与分析 45-47 4.4.1 实验数据描述 45 4.4.2 实验方法 45 4.4.3 实验结果与分析 45-47 4.5 本章小结 47-48 第5章 总结与展望 48-49 5.1 本文的主要研究工作 48 5.2 主要创新点及展望 48-49 参考文献 49-56 在校期间的研究成果及发表的学术论文 56-57 致谢 57
|
相似论文
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
- 跨平台模具CAD系统研究与应用,TP391.72
- 跨平台DICOM打印的研究与实现,R197.324
- 设计模式在嵌入式软件设计中的研究与应用,TP311.52
- 基于Web的参数化跨平台零件库系统研究与设计,TP311.52
- 嵌入式系统跨平台统一驱动框架技术研究与实现,TP311.52
- 子空间相交方位估计方法性能分析,O427
- 空间谱估计算法性能分析,TN911.23
- 基于STRAIGHT谱的语音识别算法研究,TN912.34
- 跨平台的富微件运行时系统,TP393.09
- 跨平台网络监控系统的研究与实现,TP393.06
- Krylov子空间方法的GPU加速算法研究,TP391.41
- 人脸识别技术研究,TP391.41
- 人耳及人脸融合的多模态身份识别,TP391.41
- 基于最大后验概率与子空间学习的二维人脸变换,TP391.41
- 基于子空间方法的人脸识别技术研究,TP391.41
- 基于子空间辨识的LQG基准控制性能评价,TP273
- 高光谱影像混合像元分解技术研究,TP751
- 贝叶斯框架下的图像显著性检测,TP391.41
- 基于子空间的小型无人旋翼机的系统辨识研究,V275.1
中图分类: > 医药、卫生 > 肿瘤学 > 一般性问题 > 肿瘤诊断学
© 2012 www.xueweilunwen.com
|