学位论文 > 优秀研究生学位论文题录展示

疾病基因密码子使用特征分析及致病基因预测

作 者: 周权雄
导 师: 周艳红
学 校: 华中科技大学
专 业: 计算机应用技术
关键词: 生物信息学 特征发现 密码子使用 疾病基因预测
分类号: R363
类 型: 硕士论文
年 份: 2006年
下 载: 96次
引 用: 0次
阅 读: 论文下载
 

内容摘要


定位候选策略是目前发现疾病基因的主要方法,其关键问题之一是如何对采用连锁分析等方法定位的疾病区间中数以百计的候选基因进行致病风险评估。有效解决这一问题对于缩短疾病基因发现周期、减少花费等都具有重要意义。越来越多的疾病基因被发现,使得采用计算机方法从已知疾病基因中获取知识以帮助发现未知疾病基因成为可能。但是,目前基于表达信息、基因功能以及疾病基因统计特征的三种方法都不能很好地解决这一问题。因为基于表达信息和基因功能的方法的效果严重依赖于表达与功能信息的完整性与准确性,而目前基于疾病基因序列特征的方法仅仅考虑所有疾病基因和正常基因的序列特征在统计水平的差异,没有对不同的疾病区别对待。为了更好地解决这一问题,发现不同疾病的致病基因所特有的序列特征是一种新的途径。密码子使用特征因为其蕴涵的丰富的生物学意义而被选作本研究重点挖掘的特征。一种新的方法被用来提取疾病基因中密码子的使用特征,结果发现导致同一种疾病的致病基因的密码子使用常常表现出疾病特异性,即同种疾病的致病基因之间密码子使用非常相似,而与其他基因则存在显著差别。基于这种疾病特异的密码子使用特征,设计了一种新的预测疾病基因的方法。对46种已知疾病基因个数不小于3、显著性P值小于0.1的疾病的致病基因进行leave-one-out交叉验证的结果表明,该方法能够从数以百计的候选基因中把15%的疾病基因预测为最高优先级,约1/3的疾病基因位于前3,2/3的疾病基因位于前15。该方法的显著特点在于其只需要知道候选基因的编码序列,因而可以对任何一个候选基因进行分析,无论其功能与表达信息是否已知,而且该方法针对疾病进行特征挖掘,其预测结果更具有针对性,假阳性结果更少。在此基础上,结合新基因预测技术、功能预测技术和疾病基因预测技术设计了一个发现特定疾病相关新基因的分析系统,并以心血管疾病为例进行了大规模的分析,取得了一批有参考价值的结果,可通过http://infosci.hust.edu.cn访问。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-17
  1.1 课题来源  9
  1.2 研究背景、目的、意义  9-11
  1.3 国内外研究现状分析  11-16
  1.4 主要研究内容  16
  1.5 本文内容安排  16-17
2 疾病基因密码子使用特征分析  17-28
  2.1 研究数据的获取  17-22
  2.2 密码子使用特征的分析方法  22-24
  2.3 疾病特异的密码子使用特征  24-27
  2.4 本章小结  27-28
3 基于密码子使用特征预测疾病基因  28-39
  3.1 疾病基因预测方法设计  28-29
  3.2 性能测试  29-34
  3.3 疾病基因未知区间的疾病基因预测  34-35
  3.4 结果讨论  35-38
  3.5 本章小结  38-39
4 疾病相关新基因挖掘系统  39-49
  4.1 系统设计  39-42
  4.2 系统实现  42-45
  4.3 应用实例:心血管疾病  45-48
  4.4 本章小结  48-49
5 结论  49-51
致谢  51-52
参考文献  52-56
附录 攻读学位期间发表论文目录  56

相似论文

  1. BioLab面向生物计算服务的网格系统,TP399-C8
  2. 南极冰藻GPx、GST和SAHH基因的克隆、定量分析及原核表达载体的构建,Q943.2
  3. 高温蛋白酶Pgsey及解旋酶Htc16特征的初步研究,Q814
  4. 红曲霉洛伐他汀生物合成相关基因克隆与分析,TQ927
  5. 八种昆虫转录组数据中OBP、CSP和RyR基因预测及序列分析,S433
  6. 小麦基因电子表达分析平台的构建及相对于水稻的小麦特异基因的鉴定,S512.1
  7. 两个玉米转录因子ZmC4HC3和ZmNAC的克隆与表达分析,S513
  8. 水稻Rho家族OsRacD及其5种潜在互作蛋白的生物信息学分析,S511
  9. 斯氏按蚊感染约氏疟原虫后24小时差异表达基因的筛选与分析,R531.3
  10. 家蚕HSP基因的表达调控研究,S881.2
  11. 电离辐射诱发microRNA表达改变及其对辐射损伤调控机制,R144
  12. 上海近郊某地区犬Torque Teno virus感染率调查及全基因组序列分析,S858.292
  13. 蛋白质-DNA结构模型比较及其在转录因子结合位点预测中的应用,Q51
  14. 生物途径数字化策略及其在共生固氮网络数据库中的实现,Q811.4
  15. 面向DAG数据依赖型应用系统研究与实现,TP311.1
  16. 桉树木质素合成途径两个关键基因的克隆与功能研究,S792.39
  17. 新疆梨种质资源分子标记及自交不亲和基因克隆,S661.2
  18. CIMMYT玉米种质Ent17大斑病抗性基因解析及Ht1生物信息学分析,S435.11
  19. 人类miRNA调控因子及靶基因的基因本体分析,R346
  20. pAdtrack-cmv-rHSG重组穿梭质粒载体的构建、序列分析及rHSG生物信息分析,R346
  21. DNA序列的最大频繁模式挖掘,TP311.13

中图分类: > 医药、卫生 > 基础医学 > 病理学 > 病理生理学
© 2012 www.xueweilunwen.com