学位论文 > 优秀研究生学位论文题录展示

有监督的主成分分析及偏Cox回归模型在基因数据生存预测中的应用

作 者: 覃婷
导 师: 王彤
学 校: 山西医科大学
专 业: 流行病与卫生统计学
关键词: 基因数据 生存分析 有监督的主成分回归 偏Cox回归
分类号: R195
类 型: 硕士论文
年 份: 2010年
下 载: 74次
引 用: 0次
阅 读: 论文下载
 

内容摘要


目的:基因表达数据存在着高维度、强相关以及小样本的特点,不满足经典的统计方法的要求。因此用传统的Cox比例风险模型进行基因数据生存分析存在困难。有监督的主成分回归和偏Cox回归方法将降维方法与Cox比例风险模型相结合,可以解决高维生物信息数据的生存预测问题。我们试图通过模拟研究以及实例分析更好的揭露死亡时间(或者其它健康事件结局的时间)和基因数据之间的关系,为病人得到更精确的预后和改进治疗策略提供合理的方法学依据。方法:介绍有监督的主成分分析和偏Cox回归模型的基本原理以及方法步骤。针对基因数据的协变量个数大于样本例数,以及变量间存在相关性等特点进行模拟研究,并对国际上公开的三个基因数据集进行分析,考察两种模型的预测性能。采用R软件进行数据模拟,MATLAB7.1进行数据分析。结果:以deviance偏差和决定系数R2作为模型预测性能的评价标准,从模拟实验中我们看到,随着影响生存的基因块的方差的增大及组内相关系数ρ的增高,两种方法的预测性能变好;随着删失比例的增加,两种方法的预测性能变差。在实例分析的三个数据集中,不同的数据集得到的何种方法最优的结论不同。结论:SuperPC和偏Cox回归都具有降维的作用,适用于基因数据的生存分析。尽管在模拟中,按照各自的预测性能准则选取预测算子时SuperPC比偏Cox回归的表现要好。偏Cox回归计算速度较快,这也是它的一个优点。

全文目录


摘要  5-6
ABSTRACT  6-8
前言  8-10
第一章 有监督的主成分分析和偏COX回归  10-26
  1.1 基因微阵列数据的比例风险模型  10-11
  1.2 有监督的主成分回归的基本原理及分析步骤  11-14
    1.2.1 有监督的主成分回归的概念及基本思想  11
    1.2.2 有监督主成分回归的分析步骤  11-13
    1.2.3 参数调整  13-14
  1.3 偏Cox回归的基本原理及分析步骤  14-22
    1.3.1 偏Cox回归的概念及基本思想  14
    1.3.2 Cox回归的IRLS算法  14-17
    1.3.3 偏Cox回归  17-20
    1.3.4 偏Cox回归模型的成分数的确定  20
    1.3.5 包含非基因协变量的偏Cox回归  20-21
    1.3.6 偏Cox方法计算方面的改进  21-22
  1.4 根据交叉验证法选择模型调整参数  22-23
  1.5 方法的比较  23-26
    1.5.1 定性比较  23-24
    1.5.2 模型的定量评价  24-26
第二章 模拟研究及实例分析  26-33
  2.1 模拟研究  26-29
    2.1.1 模拟实验设计  26-27
    2.1.2 模拟数据分析及结果  27-29
  2.2 实例分析  29-32
    2.2.1 数据集介绍  29-30
    2.2.2 实例分析结果  30-32
  2.3 小结  32-33
第三章 讨论  33-35
参考文献  35-37
附录  37-41
个人简介  41-42
致谢  42

相似论文

  1. 中亚热带两种常绿阔叶林群落细根寿命估计,S718.5
  2. 基于生存分析方法的房地产上市公司财务风险评价研究,F224
  3. 结直肠癌病人血清中CEA、CA19-9、LN与预后关系的研究,R735.3
  4. 惩罚COX模型和弹性网技术在高维数据生存分析中的应用,R73-31
  5. 基于生存分析的上市公司财务风险预警研究,F224
  6. Cyr61基因表达与食管癌临床参数及预后关系的研究,R735.1
  7. CTGF基因在食管癌中的表达及与患者预后关系的研究,R735.1
  8. Caspase-8表达与食管癌关系的研究,R735.1
  9. 维持性血液透析患者动静脉内瘘生存分析,R473.5
  10. 河南省林州市人群食管癌、胃癌现时生存率分析,R735
  11. Ebp1与食管癌和贲门癌发生发展及预后关系的研究,R735
  12. 61781例家族性和散发食管癌临床病理和生存期及与PLCE1和RFT2基因多态相关性,R735.1
  13. 影响肾细胞癌患者预后的因素分析,R737.11
  14. 非小细胞肺癌中淋巴细胞浸润和CTGF表达与预后的关系,R734.2
  15. 89例手术治疗胰腺癌患者临床资料分析,R735.9
  16. MGb2-Ag在结直肠癌的表达及预后研究,R735.3
  17. 定制肿瘤型假体置换术后假体生存及并发症的发生和原因分析,R687.3
  18. 基于生存分析的民营企业财务风险研究,F276.5;F224
  19. 乌兰布和沙漠天然梭梭种群特征分析,S718.5
  20. 原发性肝癌420例综合治疗分析,R735.7
  21. Connexin 26在胃癌中的表达和对预后的影响及相关机制的初步研究,R735.2

中图分类: > 医药、卫生 > 预防医学、卫生学 > 保健组织与事业(卫生事业管理) > 卫生调查与统计
© 2012 www.xueweilunwen.com