学位论文 > 优秀研究生学位论文题录展示

蛋白质超二级结构库的建立及其序列统计分析

作 者: 李彩艳
导 师: 胡秀珍
学 校: 内蒙古工业大学
专 业: 计算数学
关键词: 蛋白质 超二级结构 数据库 统计分析 Fisher判别法
分类号: Q51
类 型: 硕士论文
年 份: 2007年
下 载: 88次
引 用: 0次
阅 读: 论文下载
 

内容摘要


蛋白质是生命活动的物质基础,生命活动几乎都是通过蛋白质实现的,而蛋白质的功能又与其结构紧密相关。所以知道一个蛋白质的结构对了解其功能是非常关键的。目前,在Swiss-prot(8.7版本)库中包含3421677个已知一级序列的蛋白质,而在PDB(2006.9.19)库中只包含38882个已知结构的蛋白质。实验测定的蛋白质结构比已知的蛋白质序列要少得多。实验测定蛋白质结构主要有X射线衍射法、核磁共振法等技术,但过程非常复杂,且代价较高。Anfinsen提出假说:蛋白质一级结构决定着蛋白质的空间结构。因此从蛋白质序列出发预测空间结构,揭示生物分子数据的内涵是生物信息学的重要研究课题。但直接从蛋白质的序列出发来预测高级结构仍很困难,尤其是三级结构的预测。已有报告表明蛋白质折叠主要由许多简单的超二级结构单元构成,由超二级结构获得的结构信息可用于三级结构的预测。如果知道了蛋白质简单超二级结构的模体构象,再预测三级结构,那么问题就会简单得多。所以蛋白质超二级结构预测是从一级序列预测三维结构的桥梁。本文主要工作是蛋白质超二级结构库的建立及其序列的统计分析:选取了SCOP数据库1.69版本中同源性小于40%的蛋白质6819,从PDB库中都找到每一个氨基酸对应的二级结构,在对蛋白质序列分析、整理基础上,给出五类超二级结构序列模式α-α、α-β、β-α、β-βhairpin和β-βlink共61824个;并根据Loop的长度进一步分类,建立了相应的蛋白质超二级结构数据库;并对五类蛋白质超二级结构序列所含20种氨基酸的概率作了统计分析,与相关工作做了比较,得到蛋白质超二级结构中的一系列有益信息;最后利用Fisher判别法对蛋白质超二级结构中Strand-Loop-Strand两类模体进行分类,得到较好效果。

全文目录


摘要  3-4
Abstract  4-9
第一章 绪论  9-14
  1.1 课题研究背景  9-10
  1.2 课题研究的必要性和国内外研究概况  10-12
    1.2.1 课题研究的必要性  10-11
    1.2.2 国内外研究概况  11-12
  1.3 本文主要研究内容安排  12-14
第二章 蛋白质结构及简单超二级结构模体简介  14-19
  2.1 引言  14
  2.2 蛋白质的氨基酸组成和结构  14-17
    2.2.1 蛋白质的氨基酸组成  14-15
    2.2.2 蛋白质的结构  15-17
  2.3 简单蛋白质超二级结构模体定义  17-18
  2.4 本章小结  18-19
第三章 蛋白质超二级结构数据库的建立  19-29
  3.1 引言  19
  3.2 蛋白质超二级结构数据库的建立  19-25
    3.2.1 PDB 数据库简介  19-20
    3.2.2 SCOP 数据库简介  20-22
    3.2.3 蛋白质序列的分析及蛋白质超二级结构数据库的建立  22-25
  3.3 与ARCHDB 数据库的比较  25-28
  3.4 本章小结  28-29
第四章 五类蛋白质超二级结构序列的统计分析  29-37
  4.1 引言  29
  4.2 LOOP序列的统计分析  29-32
  4.3 LOOP序列N 端C 端及其连接规则二级结构序列的统计分析  32-36
  4.4 本章小结  36-37
第五章 蛋白质超二级结构中STRAND-LOOP-STRAND 两类模体的分类  37-54
  5.1 引言  37
  5.2 数据集  37-38
    5.2.1 数据集建立  37-38
    5.2.2 ARCHD840 数据集  38
  5.3 FISHER判别法  38-41
    5.3.1 FISHER判别法  38-40
    5.3.2 判别值选取的改进  40-41
  5.4 序列片段长及指标的选取  41-45
    5.4.1 序列片段长的选取  41-44
    5.4.2 指标的选取  44-45
  5.5 精确度评价指标  45
  5.6 结果及讨论  45-53
    5.6.1 本文数据集结果及讨论  45-49
    5.6.2 ARCHDB 40 数据集结果及讨论  49-53
  5.7 本章小结  53-54
第六章 工作总结与展望  54-56
  6.1 工作总结  54-55
  6.2 展望  55-56
参考文献  56-60
致谢  60-61
作者简介  61-62
发表文章  62

相似论文

  1. 基于WinCE平台的故障分析仪应用程序设计与开发,TP311.52
  2. 多转录因子组合调控研究,Q78
  3. 基于蛋白质互作网络的疾病相关miRNA挖掘方法的研究,R341
  4. 电子文书安全签发系统的研制,TN918.2
  5. 海量数据压缩、操作和处理方法的研究,TP311.13
  6. 基于串核的蛋白质分类算法的研究与实现,TP301.6
  7. 基于BAP的数据压缩、操作与查询处理系统的实现,TP311.13
  8. 武器装备信息管理系统的设计与实现,TP311.52
  9. 部队在线考试系统设计与实现,TP311.52
  10. 罗非鱼分离蛋白的制备及其性质研究,TS254.4
  11. 基于GIS的高校学生社区管理研究,G647
  12. 基于数据挖掘技术的保健品营销研究,F426.72
  13. 基于感性工学的家具把手及拉手设计研究,TS664.01
  14. 改进的主成分分析方法在学科建设中的应用,G642.4
  15. 基于嵌入式的面向造纸企业的一种QCS研究与设计,TP368.1
  16. 部队人员网上训练与考核系统的开发,TP311.52
  17. 棉铃虫和烟夜蛾生殖生物学特性比较研究,S433
  18. 棉花纤维初始发育的磷酸蛋白质组学研究,S562
  19. 摩托化部队机动辅助系统,TP311.52
  20. 部队军事理论在线考试系统设计与实现,TP311.52
  21. 烟草花粉管内吞作用机制的细胞学和蛋白质组学研究,Q942

中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com