学位论文 > 优秀研究生学位论文题录展示
有监督的主成分分析及偏Cox回归模型在基因数据生存预测中的应用
作 者: 覃婷
导 师: 王彤
学 校: 山西医科大学
专 业: 流行病与卫生统计学
关键词: 基因数据 生存分析 有监督的主成分回归 偏Cox回归
分类号: R195
类 型: 硕士论文
年 份: 2010年
下 载: 74次
引 用: 0次
阅 读: 论文下载
内容摘要
目的:基因表达数据存在着高维度、强相关以及小样本的特点,不满足经典的统计方法的要求。因此用传统的Cox比例风险模型进行基因数据的生存分析存在困难。有监督的主成分回归和偏Cox回归方法将降维方法与Cox比例风险模型相结合,可以解决高维生物信息数据的生存预测问题。我们试图通过模拟研究以及实例分析更好的揭露死亡时间(或者其它健康事件结局的时间)和基因数据之间的关系,为病人得到更精确的预后和改进治疗策略提供合理的方法学依据。方法:介绍有监督的主成分分析和偏Cox回归模型的基本原理以及方法步骤。针对基因数据的协变量个数大于样本例数,以及变量间存在相关性等特点进行模拟研究,并对国际上公开的三个基因数据集进行分析,考察两种模型的预测性能。采用R软件进行数据模拟,MATLAB7.1进行数据分析。结果:以deviance偏差和决定系数R2作为模型预测性能的评价标准,从模拟实验中我们看到,随着影响生存的基因块的方差的增大及组内相关系数ρ的增高,两种方法的预测性能变好;随着删失比例的增加,两种方法的预测性能变差。在实例分析的三个数据集中,不同的数据集得到的何种方法最优的结论不同。结论:SuperPC和偏Cox回归都具有降维的作用,适用于基因数据的生存分析。尽管在模拟中,按照各自的预测性能准则选取预测算子时SuperPC比偏Cox回归的表现要好。偏Cox回归计算速度较快,这也是它的一个优点。
|
全文目录
摘要 5-6 ABSTRACT 6-8 前言 8-10 第一章 有监督的主成分分析和偏COX回归 10-26 1.1 基因微阵列数据的比例风险模型 10-11 1.2 有监督的主成分回归的基本原理及分析步骤 11-14 1.2.1 有监督的主成分回归的概念及基本思想 11 1.2.2 有监督主成分回归的分析步骤 11-13 1.2.3 参数调整 13-14 1.3 偏Cox回归的基本原理及分析步骤 14-22 1.3.1 偏Cox回归的概念及基本思想 14 1.3.2 Cox回归的IRLS算法 14-17 1.3.3 偏Cox回归 17-20 1.3.4 偏Cox回归模型的成分数的确定 20 1.3.5 包含非基因协变量的偏Cox回归 20-21 1.3.6 偏Cox方法计算方面的改进 21-22 1.4 根据交叉验证法选择模型调整参数 22-23 1.5 方法的比较 23-26 1.5.1 定性比较 23-24 1.5.2 模型的定量评价 24-26 第二章 模拟研究及实例分析 26-33 2.1 模拟研究 26-29 2.1.1 模拟实验设计 26-27 2.1.2 模拟数据分析及结果 27-29 2.2 实例分析 29-32 2.2.1 数据集介绍 29-30 2.2.2 实例分析结果 30-32 2.3 小结 32-33 第三章 讨论 33-35 参考文献 35-37 附录 37-41 个人简介 41-42 致谢 42
|
相似论文
- 中亚热带两种常绿阔叶林群落细根寿命估计,S718.5
- 基于生存分析方法的房地产上市公司财务风险评价研究,F224
- 结直肠癌病人血清中CEA、CA19-9、LN与预后关系的研究,R735.3
- 惩罚COX模型和弹性网技术在高维数据生存分析中的应用,R73-31
- 基于生存分析的上市公司财务风险预警研究,F224
- Cyr61基因表达与食管癌临床参数及预后关系的研究,R735.1
- CTGF基因在食管癌中的表达及与患者预后关系的研究,R735.1
- Caspase-8表达与食管癌关系的研究,R735.1
- 维持性血液透析患者动静脉内瘘生存分析,R473.5
- 河南省林州市人群食管癌、胃癌现时生存率分析,R735
- Ebp1与食管癌和贲门癌发生发展及预后关系的研究,R735
- 61781例家族性和散发食管癌临床病理和生存期及与PLCE1和RFT2基因多态相关性,R735.1
- 影响肾细胞癌患者预后的因素分析,R737.11
- 非小细胞肺癌中淋巴细胞浸润和CTGF表达与预后的关系,R734.2
- 89例手术治疗胰腺癌患者临床资料分析,R735.9
- MGb2-Ag在结直肠癌的表达及预后研究,R735.3
- 定制肿瘤型假体置换术后假体生存及并发症的发生和原因分析,R687.3
- 基于生存分析的民营企业财务风险研究,F276.5;F224
- 乌兰布和沙漠天然梭梭种群特征分析,S718.5
- 原发性肝癌420例综合治疗分析,R735.7
- Connexin 26在胃癌中的表达和对预后的影响及相关机制的初步研究,R735.2
中图分类: > 医药、卫生 > 预防医学、卫生学 > 保健组织与事业(卫生事业管理) > 卫生调查与统计
© 2012 www.xueweilunwen.com
|