学位论文 > 优秀研究生学位论文题录展示

蛋白质序列空间曲线构造及相似性分析

作 者: 耿长春
导 师: 李重
学 校: 浙江理工大学
专 业: 基础数学
关键词: 蛋白质图形表示 相似性分析 进化树 聚类 Bézier样条曲线
分类号: Q51
类 型: 硕士论文
年 份: 2014年
下 载: 2次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着测序技术的迅猛发展,生物序列的数量在数据库中呈指数形式增长。对于海量的生物数据,如何进行信息提取、比较分析、关系挖掘,已成为当代分子生物学和生物信息学的一个重要任务。直接从杂乱无章的生物序列本身提取信息、发现其隐藏的规律,已经相对比较困难。生物数据的可视化研究为人们处理海量的生物数据提供了一种新的途径。如何有效利用生物序列的图形表示形式对序列进行分类及生物进化关系的分析,是生物信息学的一个重要研究课题。本文我们围绕蛋白质序列的图形表示方法、相似性分析方法、进化树构建算法进行了研究,具体的研究工作如下:(1)我们给出了一种新的蛋白质图形表示方法。首先基于氨基酸的3个理化性质对蛋白质序列构造三维离散空间点列;然后使用三次Bézier样条曲线插值蛋白质序列空间点列将其转化为空间连续参数曲线,可使蛋白质序列的3D空间表示具有更好可视性。(2)基于空间曲线的微分几何属性(曲率),我们给出了一种新的蛋白质序列相似性比较方法。首先提取曲线的曲率特征,并利用这些曲率特征构造频率向量;然后我们计算向量之间的L1距离来对蛋白质序列进行相似性分析;最后我们以9个不同物种线粒体NADH脱氢酶(ND5)序列为例,进行了数值描述和相似性分析,并做了相关系数及显著性检验,实验结果验证了本文方法的有效性。(3)基于蛋白质图形表示,我们给出了一种新的进化树构建算法。首先基于蛋白质图形表示得到频率向量矩阵;然后对k-means算法进行了改进,提出了一种自适应聚类算法,并对频率向量矩阵进行循环迭代来构造进化树;最后我们以15个不同物种的球蛋白序列为例,构建了进化树并与Clustalx和DNAstar软件构建的进化树做了比较,实验结果证明了本文方法的合理性及可行性。

全文目录


摘要  4-5
Abstract  5-8
第一章 绪论  8-19
  1.1 研究背景和意义  8-9
  1.2 研究现状  9-17
    1.2.1 生物序列图形表示的研究现状  9-14
    1.2.2 生物序列相似性分析的研究现状  14-15
    1.2.3 进化树构建算法研究现状  15-17
  1.3 本文的工作  17-19
    1.3.1 本文的主要研究内容  17-18
    1.3.2 论文的组织框架  18-19
第二章 基于三维模型的蛋白质序列图形表示  19-27
  2.1 基于理化性质的蛋白质序列空间离散点列表示  19-21
  2.2 基于三次 Bézier 样条曲线的图形表示  21-26
    2.2.1 空间连续曲线选择  21
    2.2.2 反求控制点及曲线构造  21-26
  2.3 本章小结  26-27
第三章 基于曲率的蛋白质序列的特征提取和相似性分析  27-36
  3.1 蛋白质序列的特征提取  27-30
    3.1.1 曲线几何特性的选择  27-28
    3.1.2 蛋白质序列特征提取算法  28-30
  3.2 蛋白质序列相似性分析  30-34
    3.2.1 蛋白质序列相似性比较  30-32
    3.2.2 实验结果分析  32-34
  3.3 本章小结  34-36
第四章 基于自适应聚类算法的进化树构建  36-46
  4.1 常用聚类算法  36-38
  4.2 基于 K-means 算法自适应聚类算法  38
  4.3 基于图形表示和改进聚类算法的进化树构造  38-45
    4.3.1 实验数据  38-39
    4.3.2 实验步骤  39-40
    4.3.3 实验结果及分析  40-45
  4.4 本章小结  45-46
第五章 总结和展望  46-48
  5.1 研究工作总结  46-47
  5.2 研究工作展望  47-48
参考文献  48-52
攻读硕士学位期间的研究成果  52-53
致谢  53

相似论文

  1. 隐式用户兴趣挖掘的研究与实现,TP311.13
  2. 图像分割中阴影去除算法的研究,TP391.41
  3. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  4. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  5. 大学生综合素质测评研究,G645.5
  6. 21个荷花品种遗传多样性的ISSR分析,S682.32
  7. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  8. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  9. 鸡传染性支气管炎病毒河南地方株分离鉴定及HN104株与HN091株全基因组序列测定,S852.65
  10. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  11. 南通市农业面源污染负荷研究与综合评价,X592
  12. 土壤环境功能区划研究,X321
  13. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  14. 大豆杂种优势及其遗传基础研究,S565.1
  15. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
  16. 平顶山烤烟综合质量评价及与美国烤烟的对比分析,S572
  17. 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1
  18. 基于多因素模糊聚类的底板突水危险性预测研究,TD745
  19. 模糊神经网络在扫雷犁系统中的应用研究,TJ518
  20. 基于模糊聚类的图像检索方法研究及其系统实现,TP391.41
  21. 肺炎克雷伯菌耐药机制及分子流行病学研究,R446.5

中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com