学位论文 > 优秀研究生学位论文题录展示

基于神经网络的蛋白质二级结构预测问题的研究

作 者: 孙海军
导 师: 阮晓钢
学 校: 北京工业大学
专 业: 模式识别与智能控制
关键词: 氨基酸序列编码 蛋白质二级结构 神经网络
分类号: Q51
类 型: 硕士论文
年 份: 2004年
下 载: 263次
引 用: 2次
阅 读: 论文下载
 

内容摘要


蛋白质二级结构预测问题是生物信息学的重要问题之一。本文对蛋白质二级结构 预测问题进行了研究,建立了蛋白质二级结构预测数据库。研究了蛋白质的基本组成 成分氨基酸的编码方式。基于 BP 神经网络建立了单神经网路和多神经网络的预测模 型。并利用它们对蛋白质二级结构进行了预测研究。其主要研究内容和成果如下: (1)蛋白质二级结构评测数据库的建立 论文首先从同源蛋白质数据库(Homology Derived Secondary Structure of Proteins,简称 HSSP)中提取出 36 个蛋白质文件:针对其包含复杂的数据形式,设计 了一个提取数据的方法,对蛋白质数据进行预处理,提取出氨基酸序列。建立了由这 些氨基酸序列构成的数据库。为蛋白质二级结构预测打下了良好的基础。 (2)5 种氨基酸编码方式的比较研究 论文针对正交编码、5 位编码、Codorl(基本型)编码、Codorl(扩展型)编码及 Profile 编码等 5 常用的编码方法。利用 BP 神经网络,建立了蛋白质二级结构预测的评测模型。 运用该模型研究分析了这 5 种编码方式对蛋白质二级结构预测精度的影响。结果表明, 用富含“生物进化信息”的 Profile 编码方式可以得到较高的预测结果。 (3)基于多神经网络的蛋白质二级结构预测模型 论文提出了一个由 7 个 BP 神经网络组合成的多神经网络的蛋白质二级结构预测模 型,该模型采用“profile”编码方式和氨基酸间的“距离”为激励输入信息,对蛋白 质二级结构进行了预测。论文对从 36 个蛋白质提取的共 4000 个氨基酸的进行了预测研 究和分析。结果表明,本文的多神经网络优于 Zhu 等人提出的多神经预测模型[19],它 把蛋白质二级结构预测的平均精度从 66.1 502%[19]提高到 68.8903%。 本课题得到了国家自然科学基金的支持。

全文目录


摘要   4-5
Abstract  5-8
第1章 绪 论  8-22
  1.1 课题的研究背景及意义  8-10
  1.2 课题相关领域的研究和发展  10-19
    1.2.1 蛋白质二级结构预测的发展  10-12
    1.2.2 蛋白质二级结构预测的预测方法  12-14
    1.2.3 人工神经网路在蛋白质二级预测中的应用  14-19
  1.3 本课题的主要工作  19-20
  1.4 论文的组织  20-22
第2章 评测数据库的建立  22-31
  2.1 引言  22
  2.2 生物信息数据库  22-23
  2.3 蛋白质数据库  23-26
    2.3.1 PIR和 PSD数据库  23-24
    2.3.2 SWISS-PROT数据库  24-25
    2.3.3 PROSITE数据库  25
    2.3.4 PDB数据库  25-26
    2.3.5 SCOP数据库  26
    2.3.6 HSSP数据库  26
  2.4 本文所需数据库的建立  26-31
第3章 蛋白质二级结构预测的编码方式研究和分析  31-45
  3.1 引言  31
  3.2 编码问题与编码方式  31-35
    3.2.1 正交(标准)编码方式  32
    3.2.2 5位编码方式  32-33
    3.2.3 CODON(密码子)编码方式一(基本型)  33
    3.2.4 CODON(密码子)编码方式二(“扩展型”)  33-34
    3.2.5 PROFILE编码  34-35
  3.3 评测模型  35-39
    3.3.1 结构设计  35-36
    3.3.2 网络算法  36-38
    3.3.3 预测准确率的衡量  38-39
  3.4 试验与分析  39-44
  3.5 本章小结  44-45
第4章 用多神经网络预测蛋白质二级结构  45-54
  4.1 引言  45-46
  4.2 评测模型  46-49
    4.2.1 结构设计  46-48
    4.2.2 算法设计  48-49
  4.3 试验与分析  49-53
  4.4 本章小结  53-54
结 论  54-56
参考文献  56-61
致 谢  61

相似论文

  1. 天然气脱酸性气体过程中物性研究及数据处理,TE644
  2. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  3. 调频式电容位移传感器高速测频与非线性校正技术研究,TH822
  4. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  5. 红外超光谱图像的虚拟探测器研究,TP391.41
  6. 模糊控制、神经网络在平面二级倒立摆中的应用,TP273.4
  7. 基于神经网络的水厂投药预测控制研究,TP273.1
  8. 视觉伺服四自由度机械臂的研究,TP242.6
  9. 机械臂视觉伺服系统的研究,TP242.6
  10. 压电驱动微工作台的控制与校正技术研究,TP273
  11. 某武器检测装置的控制系统设计,TP183
  12. 市级旅游用地规划环境影响评价研究,X820.3
  13. 珠三角地区高性能混凝土配合比智能化系统,TU528
  14. 大学生综合素质测评研究,G645.5
  15. 不具备全局Lipschitz条件的时滞细胞神经网络的反周期解研究,TP183
  16. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  17. 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
  18. 基于神经网络辨识的同步发电机励磁控制研究,TM31
  19. 基于BP神经网络的水稻干燥智能控制研究,S226.6
  20. 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
  21. 海上平台消防系统研究,U698.4

中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com