学位论文 > 优秀研究生学位论文题录展示

基于柔性神经树及其集成的蛋白质三级结构预测

作 者: 黄秀
导 师: 陈月辉
学 校: 济南大学
专 业: 计算机应用技术
关键词: 蛋白质三级结构 特征提取 伪氨基酸组成 柔性神经树 集成学习
分类号: TP181
类 型: 硕士论文
年 份: 2011年
下 载: 73次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着结构基因组的出现,通过结构进行生物功能预测已经发展成为结构生物学和生物信息学的主要目的之一。蛋白质的功能大体由它的三级结构决定的。研究蛋白质的结构有非常重要的意义,可以有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,了解蛋白质与蛋白质之间的相互作用,而且对生物学、医学和药学都有非常重要的作用。因此了解蛋白质的三级结构是了解其功能的前提。本文系统的介绍了蛋白质三级结构、蛋白质表示方法、柔性神经树以及集成学习的基本理论,在总结前人研究的基础上,提出了使用柔性神经树及其集成预测蛋白质三级结构,其中采用多表达式编程算法对柔性神经树树结构进行优化,模型中各个参数采用粒子群优化算法进行优化。集成学习采用了纠错输出编码,并且详细的对纠错输出编码的基本原理和结果决策方法进行了阐述,将多分类问题巧妙的转化成两分类问题,从而达到较好的预测结果。本文使用柔性神经树预测蛋白质三级结构主要分为三个阶段:蛋白质特征提取、建立预测模型和集成学习。(1)蛋白质特征提取。为了方便计算机更好的处理数据,首先要对蛋白质进行特征提取,即将蛋白质的氨基酸残基序列转化为输入空间向量的过程,也称为编码过程。特征的选取对于预测结果非常重要,目前常用的表示蛋白质特征的方法有主要有氨基酸组成模型(AA)、多肽组成模型、伪氨基酸组成(PseAA)、疏水模式等。本文重点运用伪氨基酸组成作为输入特征,并结合其它特征进行特征融合。实验表明使用伪氨基酸组成和其他特征的融合取得了较好的预测精度。(2)建立预测模型。柔性神经树克服了其它非线性模型存在的速度慢、网络结构不易调整等缺陷,具有以下优点:不需要事先设计网络的输入、输出和网络结构,柔性神经树模型可以自动的设计和优化网络结构和参数;各层之间的连接不必是完全的,允许跨层之间的连接;柔性神经树的进化结果通常要比一般神经网络结构简单、泛化推广效果好;本文选用柔性神经树作为预测模型,其中采用多表达式编程算法对柔性神经树结构进行优化,模型中各个参数采用粒子群优化算法进行优化。(3)为了进一步提高分类器的性能,最后将分类器进行集成学习。通过使用数据集C204和640进行结果验证表明集成学习对最后的预测精度有很大的提高。

全文目录


摘要  8-10
ABSTRACT  10-12
第一章 绪论  12-14
  1.1 相关知识背景  12-13
  1.2 蛋白质结构的重要性  13
  1.3 论文内容安排  13-14
第二章 蛋白质三级结构预测  14-26
  2.1 蛋白质相关知识及其三级结构概述  14-17
    2.1.1 蛋白质相关知识  14-16
    2.1.2 蛋白质三级结构概述  16-17
  2.2 蛋白质三级结构预测方法  17-19
    2.2.1 比较建模法  17-18
    2.2.2 从头预测方法  18
    2.2.3 折叠模式识别  18-19
  2.3 应用于生物信息学领域的机器学习方法  19-26
    2.3.1 神经网络  20-22
    2.3.2 贝叶斯网络  22-23
    2.3.3 隐马尔可夫模型  23-24
    2.3.4 支持向量机  24-26
第三章 柔性神经树及其理论基础  26-36
  3.1 概述  26
  3.2 编码规则  26-27
  3.3 适应值函数  27-28
  3.4 参数优化  28-34
    3.4.1 多表达式编程  28-31
    3.4.2 粒子群优化算法  31-33
    3.4.3 多表达式编程算法和粒子群优化算法的优点  33-34
  3.5 柔性神经树算法流程  34-36
第四章 集成学习  36-42
  4.1 集成学习的概念  36-37
  4.2 基本分类器的构造  37-40
    4.2.1 处理训练数据集  37-38
    4.2.2 对输入特征进行处理  38-39
    4.2.3 通过处理类标号  39-40
    4.2.4 通过处理学习算法  40
  4.3 分类器集成方法  40
  4.4 集成方法的性能  40-42
第五章 预测模型设计与结果分析  42-60
  5.1 引言  42
  5.2 数据集  42-43
    5.2.1 C204 数据集  43
    5.2.2 25PDB 数据集  43
    5.2.3 640 数据集  43
    5.2.4 1189 数据集  43
  5.3 编码规则与分类方法  43-50
    5.3.1 考虑顺序的编码方法  43-44
    5.3.2 不考虑顺序的编码方法  44-49
    5.3.3 多分类问题  49-50
  5.4 柔性神经树预测蛋白质三级结构  50-55
    5.4.1 实验设计  50-52
    5.4.2 结果分析  52-55
  5.5 集成柔性神经树预测蛋白质三级结构  55-60
    5.5.1 集成柔性神经树设计  55-57
    5.5.2 结果分析  57-60
第六章 总结与展望  60-62
  6.1 全文总结  60-61
  6.2 展望  61-62
参考文献  62-66
致谢  66-68
附录  68
  一、在校期间发表的学术论文  68
  二、在校期间获奖情况  68

相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  4. Q学习在基于内容图像检索技术中的应用,TP391.41
  5. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  6. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  7. 空间交会接近视觉测量方法研究,TP391.41
  8. 图像实时采集、存储与处理方法研究,TP391.41
  9. 唇读中的特征提取、选择与融合,TP391.41
  10. 多币种纸币处理技术的研究与实现,TP391.41
  11. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  12. 基于图像的路面破损识别,TP391.41
  13. 移动机器人视觉检测和跟踪研究,TP242.62
  14. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  15. 基于随机森林的植物抗性基因识别方法研究,Q943
  16. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  17. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  18. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  19. 红外图像目标识别及跟踪技术研究,TP391.41
  20. 水下目标特征的压缩与融合技术研究,TN911.7
  21. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com