学位论文 > 优秀研究生学位论文题录展示

基因集富集分析在肿瘤标志物筛选中的比较研究

作 者: 张威
导 师: 陈长生
学 校: 第四军医大学
专 业: 流行病与卫生统计学
关键词: 基因表达谱 基因集富集分析 SAM-GS GAGE GlobalAncova MANOVA 肿瘤标志物
分类号: R195.1
类 型: 硕士论文
年 份: 2013年
下 载: 8次
引 用: 0次
阅 读: 论文下载
 

内容摘要


DNA微阵列技术已广泛应用于生物医学研究,成为探索生命奥秘的重要工具之一。基因表达谱反映了基因的活动信息,可以用于分析基因表达的变化情况,基因之间是否相关,在不同表型和条件下基因的表达如何受到影响;通过基因表达谱可以了解细胞当前生理状态,如细胞是正常还是恶化、药物对肿瘤细胞的有效性如何、是否敏感等。所以基因表达谱能够在医学临床诊断、药物疗效研究、揭示疾病发生机制等方面发挥着重要的作用。因此如何从实验数据中提取出有关基因的结构与功能信息,得到生物体中具体生理、病理过程的确切描述,是基因表达谱数据分析的主要研究和应用方向。由于基因表达谱数据具有高维度和样本量小的特点,并且其中含有大量未知和(或)无关基因,如何从这些海量基因信息挖掘到有用的信息,能够深层次研究基因及基因间的相互作用,已成为微阵列技术发展和应用的主要问题。目前,基因表达谱数据分析方法的研究已成为生物与医学统计学研究领域的重要任务和热点问题。本研究基于微阵列中基因集富集差异表达(Gene Set EnrichmentAnalysis)的基因表达谱数据分析方法,围绕筛选差异表达富集基因集、自限性原假设分析方法、一元和多元的分析方法在肿瘤生物标志物(Biomarker)筛选中应用的有效性和可靠性的比较性研究。本研究主要做了以下工作:1.简要介绍了基因芯片中实验设计方法、微阵列数据的预处理及其标准化方法。回顾了微阵列数据基因集富集差异表达分析的统计方法。根据微阵列研究统计设计和数据资料类型,分别引入了目前在实际应用中统计方法上较具有代表性的一元的基因集富集分析方法SAM-GS和GAGE以及多元的基因集富集分析方法GlobalAncova和MANOVA共四种方法,介绍了其各自的理论基础和特点。2.探讨了在微阵列数据中基因集的定义和其特点,基因集富集分析方法及其较单基因差异表达分析的优势所在,以及其在生物医学中的开发和应用。探讨了肿瘤生物医学研究中的难点,重点讨论了肿瘤标志物对于肿瘤病人的早期诊断和治疗的意义。微阵列基因集富集分析如何在筛选肿瘤标志物方面发挥其优势和作用,以及如何来评价基因集富集分析方法在筛选肿瘤标志物的效率和准确度。3.采用NCI60肿瘤细胞系数据,选定已知生物学证据的由p53、PTEN和p16分别参与构成的信号通路(基因集)作为阳性目的检测指标,对应的RAC1、PRKARB2和PRKACB参与构成的基因集为阴性目的检测指标。分别以四种基因集富集分析方法对数据的分析,比较其各自检出结果与包含已知突变和野生基因集的符合程度,判断其检出效率,通过计算ROC曲线下面积,对四种方法给以客观的评价。在样本量较小的情况下,一元的分析方法SAM-GS和GAGE的检验效率高于多元的分析方法GlobalAncova和MANOVA,随着样本量增大,四种方法间的效率差异减小,一元的方法仍旧保持较好的稳定性和可重复性,以GAGE的表现最佳。4.为了检验四种不同的方法在实际数据中的应用结果,进一步对四种基因集富集分析方法进行实例研究,分别选用结肠癌数据GSE4107和非小细胞肺癌数据GSE3593,筛选不同表型间差异表达的基因集,结合生物学研究结果,比较四种方法分析得到的有统计学意义的差异表达富集基因集与已有的生物学研究证据是否相符,对四种方法在实际应用分析中的效率给以评价,探讨如何选择合适的分析方法更能有效地筛选出潜在的目标肿瘤标志物。在实例研究结果中可以观察到与模拟实验相似表现趋势,即在小样本中一元的方法优于多元方法,随着样本量的增大,方法间的差异逐渐减小,但仍旧可见一元方法更为稳定,GAGE的检验效率最高。

全文目录


相似论文

  1. 基于RNA测序技术的马氏珠母贝珍珠囊转录组及数字基因表达谱分析,Q786
  2. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  3. 多肿瘤标志物蛋白芯片对食管癌和胆管癌诊断的临床评价,R735.1
  4. 大鼠肝再生与肝硬化发生的基因转录谱相关性及其意义研究,R575.2
  5. 联合检测乳腺癌肿瘤标志物的临床意义,R737.9
  6. TSP50在结直肠癌中的表达及其临床意义初步研究,R735.3
  7. α晶体蛋白与视网膜神经节细胞膜结合的靶蛋白的探索研究,R774.6
  8. 血常规、血清生化及标志物组合分析在结直肠癌筛查中的意义,R735.3
  9. 秦川牛Chemerin基因及其受体CMKLR1基因组织表达谱及多态性研究,S823
  10. 能蛋水平对北京油鸡后期繁殖性能的影响及睾丸基因表达谱的建立,S831.3
  11. 猪卵母细胞脂质相关基因表达谱研究,S828.2
  12. 清开灵单一组分干预缺血小鼠海马细胞分子药理机制的生物信息学研究,R285.5
  13. 家蚕限性黄茧Ys品种SSH cDNA文库构建及类胰凝乳蛋白酶基因的研究,S882
  14. 猪Lhx8的结构及在组织和附植前胚胎中的表达分析,S828
  15. 血清及胆汁肿瘤标志物在梗阻性黄疸中的诊断价值,R657.4
  16. 基于非负矩阵分解的癌症基因表达谱数据的特征提取,TP18
  17. 血清OPN,MG7-Ag,TPS在胃癌中的表达及意义,R735.2
  18. ERK1/2和JNK信号通路对大鼠再生肝8种细胞的增殖和凋亡调控作用研究,Q418
  19. 夜间低温对番茄苗期抗逆性、基因表达谱及碳水化合物代谢的影响,S641.2
  20. 人类白细胞抗原G(HLA-G)在胃癌发生发展及预后中的作用研究,R735.2
  21. 血清肿瘤标志物的测定在胃癌诊治中的应用,R735.2

中图分类: > 医药、卫生 > 预防医学、卫生学 > 保健组织与事业(卫生事业管理) > 卫生调查与统计 > 卫生统计学
© 2012 www.xueweilunwen.com