学位论文 > 优秀研究生学位论文题录展示
基于神经网络的蛋白质二级结构预测问题的研究
作 者: 孙海军
导 师: 阮晓钢
学 校: 北京工业大学
专 业: 模式识别与智能控制
关键词: 氨基酸序列编码 蛋白质二级结构 神经网络
分类号: Q51
类 型: 硕士论文
年 份: 2004年
下 载: 263次
引 用: 2次
阅 读: 论文下载
内容摘要
蛋白质二级结构预测问题是生物信息学的重要问题之一。本文对蛋白质二级结构 预测问题进行了研究,建立了蛋白质二级结构预测数据库。研究了蛋白质的基本组成 成分氨基酸的编码方式。基于 BP 神经网络建立了单神经网路和多神经网络的预测模 型。并利用它们对蛋白质二级结构进行了预测研究。其主要研究内容和成果如下: (1)蛋白质二级结构评测数据库的建立 论文首先从同源蛋白质数据库(Homology Derived Secondary Structure of Proteins,简称 HSSP)中提取出 36 个蛋白质文件:针对其包含复杂的数据形式,设计 了一个提取数据的方法,对蛋白质数据进行预处理,提取出氨基酸序列。建立了由这 些氨基酸序列构成的数据库。为蛋白质二级结构预测打下了良好的基础。 (2)5 种氨基酸编码方式的比较研究 论文针对正交编码、5 位编码、Codorl(基本型)编码、Codorl(扩展型)编码及 Profile 编码等 5 常用的编码方法。利用 BP 神经网络,建立了蛋白质二级结构预测的评测模型。 运用该模型研究分析了这 5 种编码方式对蛋白质二级结构预测精度的影响。结果表明, 用富含“生物进化信息”的 Profile 编码方式可以得到较高的预测结果。 (3)基于多神经网络的蛋白质二级结构预测模型 论文提出了一个由 7 个 BP 神经网络组合成的多神经网络的蛋白质二级结构预测模 型,该模型采用“profile”编码方式和氨基酸间的“距离”为激励输入信息,对蛋白 质二级结构进行了预测。论文对从 36 个蛋白质提取的共 4000 个氨基酸的进行了预测研 究和分析。结果表明,本文的多神经网络优于 Zhu 等人提出的多神经预测模型[19],它 把蛋白质二级结构预测的平均精度从 66.1 502%[19]提高到 68.8903%。 本课题得到了国家自然科学基金的支持。
|
全文目录
摘要 4-5 Abstract 5-8 第1章 绪 论 8-22 1.1 课题的研究背景及意义 8-10 1.2 课题相关领域的研究和发展 10-19 1.2.1 蛋白质二级结构预测的发展 10-12 1.2.2 蛋白质二级结构预测的预测方法 12-14 1.2.3 人工神经网路在蛋白质二级预测中的应用 14-19 1.3 本课题的主要工作 19-20 1.4 论文的组织 20-22 第2章 评测数据库的建立 22-31 2.1 引言 22 2.2 生物信息数据库 22-23 2.3 蛋白质数据库 23-26 2.3.1 PIR和 PSD数据库 23-24 2.3.2 SWISS-PROT数据库 24-25 2.3.3 PROSITE数据库 25 2.3.4 PDB数据库 25-26 2.3.5 SCOP数据库 26 2.3.6 HSSP数据库 26 2.4 本文所需数据库的建立 26-31 第3章 蛋白质二级结构预测的编码方式研究和分析 31-45 3.1 引言 31 3.2 编码问题与编码方式 31-35 3.2.1 正交(标准)编码方式 32 3.2.2 5位编码方式 32-33 3.2.3 CODON(密码子)编码方式一(基本型) 33 3.2.4 CODON(密码子)编码方式二(“扩展型”) 33-34 3.2.5 PROFILE编码 34-35 3.3 评测模型 35-39 3.3.1 结构设计 35-36 3.3.2 网络算法 36-38 3.3.3 预测准确率的衡量 38-39 3.4 试验与分析 39-44 3.5 本章小结 44-45 第4章 用多神经网络预测蛋白质二级结构 45-54 4.1 引言 45-46 4.2 评测模型 46-49 4.2.1 结构设计 46-48 4.2.2 算法设计 48-49 4.3 试验与分析 49-53 4.4 本章小结 53-54 结 论 54-56 参考文献 56-61 致 谢 61
|
相似论文
- 天然气脱酸性气体过程中物性研究及数据处理,TE644
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 调频式电容位移传感器高速测频与非线性校正技术研究,TH822
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 红外超光谱图像的虚拟探测器研究,TP391.41
- 模糊控制、神经网络在平面二级倒立摆中的应用,TP273.4
- 基于神经网络的水厂投药预测控制研究,TP273.1
- 视觉伺服四自由度机械臂的研究,TP242.6
- 机械臂视觉伺服系统的研究,TP242.6
- 压电驱动微工作台的控制与校正技术研究,TP273
- 某武器检测装置的控制系统设计,TP183
- 市级旅游用地规划环境影响评价研究,X820.3
- 珠三角地区高性能混凝土配合比智能化系统,TU528
- 大学生综合素质测评研究,G645.5
- 不具备全局Lipschitz条件的时滞细胞神经网络的反周期解研究,TP183
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
- 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
- 基于神经网络辨识的同步发电机励磁控制研究,TM31
- 基于BP神经网络的水稻干燥智能控制研究,S226.6
- 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
- 海上平台消防系统研究,U698.4
中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com
|