学位论文 > 优秀研究生学位论文题录展示
蛋白质超二级结构库的建立及其序列统计分析
作 者: 李彩艳
导 师: 胡秀珍
学 校: 内蒙古工业大学
专 业: 计算数学
关键词: 蛋白质 超二级结构 数据库 统计分析 Fisher判别法
分类号: Q51
类 型: 硕士论文
年 份: 2007年
下 载: 88次
引 用: 0次
阅 读: 论文下载
内容摘要
蛋白质是生命活动的物质基础,生命活动几乎都是通过蛋白质实现的,而蛋白质的功能又与其结构紧密相关。所以知道一个蛋白质的结构对了解其功能是非常关键的。目前,在Swiss-prot(8.7版本)库中包含3421677个已知一级序列的蛋白质,而在PDB(2006.9.19)库中只包含38882个已知结构的蛋白质。实验测定的蛋白质结构比已知的蛋白质序列要少得多。实验测定蛋白质结构主要有X射线衍射法、核磁共振法等技术,但过程非常复杂,且代价较高。Anfinsen提出假说:蛋白质一级结构决定着蛋白质的空间结构。因此从蛋白质序列出发预测空间结构,揭示生物分子数据的内涵是生物信息学的重要研究课题。但直接从蛋白质的序列出发来预测高级结构仍很困难,尤其是三级结构的预测。已有报告表明蛋白质折叠主要由许多简单的超二级结构单元构成,由超二级结构获得的结构信息可用于三级结构的预测。如果知道了蛋白质简单超二级结构的模体构象,再预测三级结构,那么问题就会简单得多。所以蛋白质超二级结构预测是从一级序列预测三维结构的桥梁。本文主要工作是蛋白质超二级结构库的建立及其序列的统计分析:选取了SCOP数据库1.69版本中同源性小于40%的蛋白质6819,从PDB库中都找到每一个氨基酸对应的二级结构,在对蛋白质序列分析、整理基础上,给出五类超二级结构序列模式α-α、α-β、β-α、β-βhairpin和β-βlink共61824个;并根据Loop的长度进一步分类,建立了相应的蛋白质超二级结构数据库;并对五类蛋白质超二级结构序列所含20种氨基酸的概率作了统计分析,与相关工作做了比较,得到蛋白质超二级结构中的一系列有益信息;最后利用Fisher判别法对蛋白质超二级结构中Strand-Loop-Strand两类模体进行分类,得到较好效果。
|
全文目录
摘要 3-4 Abstract 4-9 第一章 绪论 9-14 1.1 课题研究背景 9-10 1.2 课题研究的必要性和国内外研究概况 10-12 1.2.1 课题研究的必要性 10-11 1.2.2 国内外研究概况 11-12 1.3 本文主要研究内容安排 12-14 第二章 蛋白质结构及简单超二级结构模体简介 14-19 2.1 引言 14 2.2 蛋白质的氨基酸组成和结构 14-17 2.2.1 蛋白质的氨基酸组成 14-15 2.2.2 蛋白质的结构 15-17 2.3 简单蛋白质超二级结构模体定义 17-18 2.4 本章小结 18-19 第三章 蛋白质超二级结构数据库的建立 19-29 3.1 引言 19 3.2 蛋白质超二级结构数据库的建立 19-25 3.2.1 PDB 数据库简介 19-20 3.2.2 SCOP 数据库简介 20-22 3.2.3 蛋白质序列的分析及蛋白质超二级结构数据库的建立 22-25 3.3 与ARCHDB 数据库的比较 25-28 3.4 本章小结 28-29 第四章 五类蛋白质超二级结构序列的统计分析 29-37 4.1 引言 29 4.2 LOOP序列的统计分析 29-32 4.3 LOOP序列N 端C 端及其连接规则二级结构序列的统计分析 32-36 4.4 本章小结 36-37 第五章 蛋白质超二级结构中STRAND-LOOP-STRAND 两类模体的分类 37-54 5.1 引言 37 5.2 数据集 37-38 5.2.1 数据集建立 37-38 5.2.2 ARCHD840 数据集 38 5.3 FISHER判别法 38-41 5.3.1 FISHER判别法 38-40 5.3.2 判别值选取的改进 40-41 5.4 序列片段长及指标的选取 41-45 5.4.1 序列片段长的选取 41-44 5.4.2 指标的选取 44-45 5.5 精确度评价指标 45 5.6 结果及讨论 45-53 5.6.1 本文数据集结果及讨论 45-49 5.6.2 ARCHDB 40 数据集结果及讨论 49-53 5.7 本章小结 53-54 第六章 工作总结与展望 54-56 6.1 工作总结 54-55 6.2 展望 55-56 参考文献 56-60 致谢 60-61 作者简介 61-62 发表文章 62
|
相似论文
- 基于WinCE平台的故障分析仪应用程序设计与开发,TP311.52
- 多转录因子组合调控研究,Q78
- 基于蛋白质互作网络的疾病相关miRNA挖掘方法的研究,R341
- 电子文书安全签发系统的研制,TN918.2
- 海量数据压缩、操作和处理方法的研究,TP311.13
- 基于串核的蛋白质分类算法的研究与实现,TP301.6
- 基于BAP的数据压缩、操作与查询处理系统的实现,TP311.13
- 武器装备信息管理系统的设计与实现,TP311.52
- 部队在线考试系统设计与实现,TP311.52
- 罗非鱼分离蛋白的制备及其性质研究,TS254.4
- 基于GIS的高校学生社区管理研究,G647
- 基于数据挖掘技术的保健品营销研究,F426.72
- 基于感性工学的家具把手及拉手设计研究,TS664.01
- 改进的主成分分析方法在学科建设中的应用,G642.4
- 基于嵌入式的面向造纸企业的一种QCS研究与设计,TP368.1
- 部队人员网上训练与考核系统的开发,TP311.52
- 棉铃虫和烟夜蛾生殖生物学特性比较研究,S433
- 棉花纤维初始发育的磷酸蛋白质组学研究,S562
- 摩托化部队机动辅助系统,TP311.52
- 部队军事理论在线考试系统设计与实现,TP311.52
- 烟草花粉管内吞作用机制的细胞学和蛋白质组学研究,Q942
中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com
|