学位论文 > 优秀研究生学位论文题录展示

蛋白质序列的数学描述及其应用

作 者: 张艳萍
导 师: 贺平安
学 校: 浙江理工大学
专 业: 基础数学
关键词: 图形表示 数值刻画 相似性分析 蛋白质序列 氨基酸理化性质 PAM250矩阵 Gray编码 进化树 冠状病毒 H1N1 ND5
分类号: Q51
类 型: 硕士论文
年 份: 2010年
下 载: 101次
引 用: 0次
阅 读: 论文下载
 

内容摘要


蛋白质是由20个氨基酸残基组成的大分子,一个蛋白质序列可以看作是在20个氨基酸的字母表Ω上的字符串,即Ω={A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y}。因为蛋白质序列中氨基酸排列顺序在蛋白质折叠为空间结构时起重要作用,进而最终决定它的功能,所以对蛋白质序列进行深层次的分析是一个重要且有意义的工作。近几年,一些研究者将DNA序列的图形表示扩充到蛋白质序列的分析中,提出了蛋白质序列图形表示。然而DNA序列仅有4个碱基组成,要把DNA序列的图形表示应用到蛋白质序列上,需要考虑20个氨基酸按照什么样的顺序进行排列。目前主要有两种蛋白质序列的图形表示,一种是忽略同类氨基酸中的个体差异,将原来20种氨基酸分为4类或5类,这样就把蛋白质序列简化成一个4个或5个字符序列,从而减少可能的排列数。另外一种是忽略所有氨基酸之间的异同,直接根据氨基酸的字典序进行排列。我们首次提出氨基酸的循环排序概念,即把氨基酸按照某种规律排列成一个首尾相连的环。在本文中基于氨基酸的理化性质分类、PAM250替换矩阵、6阶反射Gray编码等,我们给出了几种不同的氨基酸循环排序。利用Chaos Game Representation(CGR)方法和不同的循环排序,我们得到了蛋白质序列的几种图形表示。接着,利用矩阵不变量、一阶类中心矩、图形比对等数学工具,对所得到的蛋白质序列的图形表示进行了数值刻画和数学描述,通过9个物种的线粒体NADH脱氢酶(ND5)序列的相似性比较,说明了我们的方法的有效性和可行性。最后利用得到的方法,我们分析了34种冠状病毒spike蛋白和45种流感病毒RNA聚合酶PB1的相似性,并由此推断这些物种的进化关系与分类。此外,利用得到的图形表示,我们还得到一个判断两序列匹配片断的方法。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-20
  1.1 生物信息学的研究背景和问题  9-10
  1.2 生物序列图形表示的研究概况  10-18
    1.2.1 DNA 序列的图形表示  11-12
    1.2.2 蛋白质序列的图形表示  12-18
  1.3 本文的主要工作  18-20
第2章 蛋白质序列的图形表示  20-38
  2.1 蛋白质序列的2 维图形表示  21-30
    2.1.1 基于氨基酸理化性质分类的2维图形表示  21-29
    2.1.2 基于PAM250 矩阵的循环排序  29-30
  2.2 蛋白质序列的3 维空间表示  30-37
    2.2.1 基于氨基酸的字典序得到的3维空间表示  30-32
    2.2.2 基于 6 阶反射 Gray 编码得到的 3 维空间表示  32-37
  2.3 小结  37-38
第3章 蛋白质序列的数值特征及其相似性分析  38-49
  3.1 数值刻画方法  38-39
  3.2 数值刻画方法以及相似性分析  39-47
    3.2.1 矩阵特征值集  39-41
    3.2.2 一阶类中心矩  41-43
    3.2.3 矩阵最大特征值  43-45
    3.2.4 图形比对  45-47
  3.3 小结  47-49
第4章 进化树的构建  49-73
  4.1 构建进化树的步骤  49-50
  4.2 构建进化树工具  50
  4.3 构建进化树  50-73
    4.3.1 9个物种的线粒体 NADH 脱氢酶的进化树  51-53
    4.3.2 34种冠状病毒 spike 蛋白的进化分析  53-64
    4.3.3 45种流感病毒 RNA 聚合酶 PB1 的进化分析  64-72
    4.3.4 小结  72-73
参考文献  73-78
致谢  78-79
攻读硕士学位期间的研究成果  79

相似论文

  1. 鳅超科鱼类若干基因的进化及分子系统发育分析,Q951
  2. 长江华溪蟹线粒体基因组及其种群遗传结构研究,Q953
  3. 甲型H1N1流感的传播预测与控制,R184
  4. 甲型H1N1流感病毒(2009)HA蛋白的原核表达及酶免检测研究,R392.1
  5. 中医药治疗四川地区甲型H1N1流感的临床研究,R259
  6. 新甲型H1N1流感病毒小鼠致死模型的建立及初步研究,S852.65
  7. 472例新型甲型H1N1流感的证候学分期调查与病因病机规律探讨,R259
  8. 我国部分地区猪流感病毒分子流行病学及致病性研究,S858.28
  9. 感冒/时行感冒600例发病规律的临床研究,R254.9
  10. 基于“菌毒并治”理论辨证论治108例甲型H1N1流感危重症的临床分析研究,R259
  11. 人血清、唾液和H1N1流感病毒中的蛋白糖基化分析,R341
  12. 甲型H1N1流感的中医药证治研究,R259
  13. 岭南地区甲型H1N1流感流行病学特点及中医临床证候特点,R259
  14. 银翘散加减治疗甲型H1N1流感轻症(风热夹湿证)的临床研究,R259
  15. 华南虎保护遗传学研究,S865
  16. 中国黄牛线粒体D-loop区,ND5基因和Cyt b基因多态性研究,S823.81
  17. 呼吸道病毒多重逆转录聚合酶链反应检测方法的建立及应用,R440
  18. 圈养华南虎线粒体基因NADH脱氢酶亚基5序列多态性研究,S865
  19. 华南虎、东北虎、孟加拉虎的D-loop、ND5、16S rRNA、CytB序列及其在系统进化研究中的应用,Q953
  20. 甲型H1N1流行性感冒疫苗安全性监测初步分析评价,R186

中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com