学位论文 > 优秀研究生学位论文题录展示

基于基因表达数据的胃癌特征基因选取研究

作 者: 李萍
导 师: 李建更
学 校: 北京工业大学
专 业: 模式识别与智能系统
关键词: 特征基因选取 胃癌 基因表达数据 生物信息学
分类号: R735.2
类 型: 硕士论文
年 份: 2009年
下 载: 97次
引 用: 0次
阅 读: 论文下载
 

内容摘要


胃癌是世界上危及人类身体健康的主要癌症之一。胃癌的早期发现,对胃癌的诊断和治疗有重要的意义。基因芯片技术的发展,促进了胃癌分子水平上的研究技术。从海量的胃癌基因表达数据中,挖掘出有用的信息和知识,可以更加全面的认识胃癌的基因本质,更加全面的了解“胃癌-基因”之间的关系,对推进胃癌的临床诊断和治疗,进一步研究胃癌、发现胃癌的致病机理有至关重要的作用。论文实验数据采用北京肿瘤医院提供的胃癌基因表达数据。该数据采集的样本全部来自中国,是中国人自己的数据。论文基于胃癌基因表达数据,主要围绕三个方面进行了研究:胃癌样本与正常样本的分类、胃癌亚型分类、胃癌的特异表达基因的选取。重点工作是在胃癌Lauren分型中的特征基因选取工作。实验最后得到一些比较有意义的基因。例如:CHRNA4、MEA1等。这些基因在临床上已有人证明与胃癌的发生发展和分型有密切关系。在分析方法上,本文取得的主要研究成果如下:1.提出有效的特征基因选取方法,基于巴氏距离的混合方法。混合方法结合了特征选取方法中过滤法和融合法的优点,能够快速有效地选取特征基因,从而大大降低基因表达数据的维数,提高胃癌样本的分类准确率。混合方法先对原始数据进行基于巴氏距离的基因排序。巴氏距离既考虑到基因在样本中的均值,也考虑到基因在样本中的方差分布,是比较好的信息度量指标。然后,采用顺序前向搜索方法去除基因冗余。实验最后得到7个肠型胃癌样本与弥漫型胃癌的分类特征基因,9个胃癌样本与正常样本的特征基因。2.提出一种PLS系数选择特征基因的方法。偏最小二乘(PLS)和主成分分析方法(PCA)能够有效的降低基因表达数据的维数。但是,在特征向量解释方面存在着不足。论文在基于偏最小二乘原理的基础上提出一种PLS系数的特征基因选择方法。该方法能有效的选择特征基因,并能对特征向量作出很好的解释。实验最后得到20个肠型胃癌样本与弥漫型样本的特征基因。3.将TSP(Top Coring Pairs)特征选取方法成功应用到胃癌基因表达数据处理过程中。TSP方法由2004年Donald Geman提出。据文献检索,尚未有人将其应用到胃癌基因表达数据的分类中。该方法原理简单,能够快速有效的从21378个基因中,选取出11对肠型胃癌与弥漫型胃癌的特征基因。论文最后还对TSP方法、基于巴氏距离的混合方法、PLS系数方法三种特征选取方法进行了比较性研究。

全文目录


摘要  4-5
ABSTRACT  5-9
第1章 绪论  9-24
  1.1 课题研究背景  9-15
    1.1.1 基因表达数据  9-12
    1.1.2 机器学习在生物信息学中的应用  12-15
  1.2 国内外研究现状  15-21
    1.2.1 基于基因表达数据的肿瘤特征基因选取研究概况  15-18
    1.2.2 胃癌分类及特征基因选取研究概况  18-21
  1.3 课题研究意义  21-22
  1.4 论文结构与科研成果  22-24
第2章 相关理论基础  24-37
  2.1 特征选取方法  24-27
  2.2 常用分类器  27-36
    2.2.1 支持向量机  28-31
    2.2.2 K-近邻法  31-34
    2.2.3 BP 神经网络  34-36
  2.3 本章小结  36-37
第3章 基于混合法的胃癌特征基因选取  37-46
  3.1 常用特征基因选择方法  37-40
    3.1.1 过滤法  37-38
    3.1.2 融合法  38-40
  3.2 基于巴氏距离的混合特征基因选择方法  40-41
    3.2.1 巴氏距离  40
    3.2.2 基于巴氏距离的混合方法  40-41
  3.3 分类器的选择  41
  3.4 实验  41-45
    3.4.1 数据来源  41-42
    3.4.2 实验结果  42-44
    3.4.3 结果讨论  44-45
  3.5 本章小结  45-46
第4章 基于PLS 系数方法的胃癌亚型特征基因选取  46-62
  4.1 胃癌亚型分类  46
  4.2 主成分分析方法  46-47
  4.3 偏最小二乘方法  47-49
  4.4 实验一  49-54
    4.4.1 数据来源  49
    4.4.2 实验结果  49-54
    4.4.3 结果讨论  54
  4.5 实验二  54-61
    4.5.1 数据来源  54-55
    4.5.2 实验结果  55-57
    4.5.3 结果讨论  57-61
  4.6 本章小结  61-62
第5章 基于TSP 的胃癌亚型特征基因选取  62-71
  5.1 TSP 方法原理  62-63
  5.2 实验  63-70
    5.2.1 数据来源  63
    5.2.2 实验结果  63-64
    5.2.3 结果讨论  64-70
  5.3 本章小结  70-71
结论  71-73
参考文献  73-77
攻读硕士学位期间所发表的学术论文  77-78
致谢  78

相似论文

  1. BioLab面向生物计算服务的网格系统,TP399-C8
  2. 冬凌草甲素调控周期相关蛋白抑制SGC-7901细胞增殖作用的研究,R285
  3. 南极冰藻GPx、GST和SAHH基因的克隆、定量分析及原核表达载体的构建,Q943.2
  4. CADPE抗肿瘤作用及对胃癌细胞凋亡的影响,R735.2
  5. 高温蛋白酶Pgsey及解旋酶Htc16特征的初步研究,Q814
  6. 红曲霉洛伐他汀生物合成相关基因克隆与分析,TQ927
  7. 八种昆虫转录组数据中OBP、CSP和RyR基因预测及序列分析,S433
  8. 郁仁存教授学术思想和临床经验总结与益气活血解毒方联合化疗治疗晚期胃癌的临床观察,R249
  9. PRL-3和p27在胃癌中的表达及临床意义,R735.2
  10. 小麦基因电子表达分析平台的构建及相对于水稻的小麦特异基因的鉴定,S512.1
  11. 两个玉米转录因子ZmC4HC3和ZmNAC的克隆与表达分析,S513
  12. PTEN、Caspase-7在胃癌与癌前病变中表达及意义,R735.2
  13. 黏附分子P-选择素在胃癌腹膜转移中的表达及临床意义,R735.2
  14. 趋化因子CCL22及受体CCR4与胃癌腹膜乳斑转移关系的研究,R735.2
  15. 648例胃癌回顾性分析,R735.2
  16. 水稻Rho家族OsRacD及其5种潜在互作蛋白的生物信息学分析,S511
  17. 斯氏按蚊感染约氏疟原虫后24小时差异表达基因的筛选与分析,R531.3
  18. EGFR、K-ras、P53及Ki-67蛋白在大肠癌、胃癌和食管癌表达的研究,R735
  19. 胃癌伴临床实验指标的变化特点及其与15个STR位点的关联,R735.2
  20. p53、PCNA和PTEN在胃癌组织中的表达及其临床意义研究,R735.2
  21. 趋化因子受体CXCR1、CXCR2、CCR在胃癌腹膜转移中的表达及意义,R735.2

中图分类: > 医药、卫生 > 肿瘤学 > 消化系肿瘤 > 胃肿瘤
© 2012 www.xueweilunwen.com