学位论文 > 优秀研究生学位论文题录展示

RNA二级结构预测算法的研究

作 者: 邢翀
导 师: 梁艳春
学 校: 吉林大学
专 业: 计算机科学与技术
关键词: RNA二级结构预测 粒子群算法 模糊逻辑控制 主成分分析 最小二乘法支持向量机
分类号: TP18
类 型: 博士论文
年 份: 2012年
下 载: 168次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年以来,越来越多的研究表明RNA在生命过程中发挥着非常重要的作用。RNA不仅是具有生物细胞结构的遗传讯息的中间载体,还具有基因表达调控、催化mRNA的剪接、加工和修饰RNA前体等其它重要功能。因此,对RNA分子的研究一直是生物信息学中的一个重要领域。而不同RNA所具有的功能与RNA的分子结构却有着密切的关系,为了更进一步的探索其更多的功能,就需要借助于RNA的二级结构。因为RNA分子自身所具有的难以结晶、降解速度快等特点,所以通过核磁共振(Nuclear magnetic resonance)或者X-射线晶体衍射和其他常规的实验方法预测RNA三维结构的费用高,耗时长。尽管通过常规的方法来确定RNA结构可以更加精确和可信,但是面对代价昂贵以及当前的海量数据,显然是满足不了需求的。所以,利用计算机实现的各种算法和数学方法来预测RNA二级结构成为公认的主要方法。本文对当前主流的RNA二级结构预测方法进行了较为深入地研究,包括基于热力学的方法(最小自由能方法、碱基最大配对法等);比较序列分析法(共变模型、随机上下文无关语法模型);启发式算法(遗传算法、模拟退火算法)等。通过对这些方法的研究,总结出其所各自所存在的优缺点,为本文的预测算法奠定了坚实的理论基础。首先,本文研究了使用最小二乘法支持向量机,从RNA序列特征入手对非编码RNA进行基因预测,相对于传统的支持向量机把解二次规划问题转化为求解线性方程组问题。在预测算法中结合主成分分析提取RNA序列的特征,对数据进行维数压缩,排除了主观因素的干扰,减少变量存储空间和计算量。通过对10种原核生物的tRNA序列的实验测试表明,本方法是一种能够有效预测原核生物ncRNA的方法。其次,本文研究了粒子群优化算法在RNA二级结构预测问题中的应用,提出了基于该方法来预测RNA二级结构的模型(PSOfold)。为了提高搜索最优解的能力,结合了模糊逻辑控制自适应动态地调控粒子群优化算法的参数,包括惯性权重、学习因子和粒子数量比。为了进一步解决PSOfold中的茎区排列问题,我们提出一种解转化策略,将离散值转换为一个有序的茎区组合。实验中选用了10条RNA序列分别从敏感性、特异性和F-measure度量与多种其他方法进行了比较。实验结果表明,这种方法是有效的并且优于其它基于进化算法和群智能的算法。

全文目录


摘要  4-6
Abstract  6-11
第1章 绪论  11-15
  1.1 研究背景及意义  11-12
  1.2 国内外研究现状分析  12-14
  1.3 本文组织与结构  14-15
第2章 RNA 相关理论知识  15-37
  2.1 RNA 生物知识  16-25
    2.1.1 RNA 的基本单位  16
    2.1.2 RNA 的化学组成  16-18
    2.1.3 RNA 的化学结构与其他大分子化学结构的差异  18-19
    2.1.4 RNA 的分类及其功能  19-25
  2.2 RNA 结构特征  25-34
    2.2.1 RNA 二级结构组成  26-30
    2.2.2 关于 RNA 结构中的假结问题  30-31
    2.2.3 RNA 的二级结构表示方法  31-34
  2.3 RNA 的数据库资源  34-35
  2.4 本章小结  35-37
第3章 现有 RNA 二级结构预测方法的分析  37-57
  3.1 比较序列分析方法  37-42
    3.1.1 共变模型  38-40
    3.1.2 随机上下文无关语法模型  40-42
  3.2 动态规划方法  42-47
    3.2.1 最小自由能算法  43-46
    3.2.2 碱基最大配对算法  46-47
  3.3 组合优化方法  47-50
    3.3.1 螺旋区堆积算法  48-49
    3.3.2 最大权重匹配算法  49-50
  3.4 启发式方法  50-56
    3.4.1 遗传算法  50-53
    3.4.2 遗传模拟退火算法  53-54
    3.4.3 人工神经网络算法  54-56
  3.5 本章小结  56-57
第4章 基于最小二乘法支持向量机的非编码 RNA 基因预测  57-69
  4.1 引言  57-58
  4.2 预测算法介绍  58-64
    4.2.1 主成分分析  58-59
    4.2.2 最小二乘支持向量机分类算法  59-62
    4.2.3 算法流程  62-64
  4.3 实验结果与分析  64-67
    4.3.1 实验设置  64-65
    4.3.2 实验结果分析  65-67
  4.4 本章小结  67-69
第5章 基于模糊自适应粒子群的 RNA 二级结构预测  69-87
  5.1 引言  69-70
  5.2 PSOfold 设计  70-79
    5.2.1 粒子群算法  70-73
    5.2.2 PSOfold 实现  73-79
  5.3 实验结果与分析  79-85
    5.3.1 实验设计  79-80
    5.3.2 实验结果分析  80-85
  5.4 本章小结  85-87
第6章 总结与展望  87-91
  6.1 论文总结  87-88
  6.2 存在的问题及展望  88-91
参考文献  91-99
作者简介及科研成果  99-101
致谢  101

相似论文

  1. 基于质谱的雷公藤甲素肝脏毒性代谢组学研究,R285
  2. 改进的主成分分析方法在学科建设中的应用,G642.4
  3. 有源电力滤波器及其在配电网中的应用,TN713.8
  4. 高分辨率SAR影像裸土信息提取及土壤含水量反演初探,S152.7
  5. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  6. 旅游对芦芽山国家级自然保护区典型植被的影响,S759.9
  7. 基于粒子群的分子对接算法,R91
  8. 太行山猕猴掌面花纹嵴数的形态学研究,Q954
  9. 赵官煤矿下组煤底板突水预测及防治技术研究,TD745
  10. 重庆市汽车产业有效竞争研究,F426.471
  11. 基于特征选择的入侵检测研究,TP393.08
  12. 川陕渝制造业竞争力比较研究,F224
  13. 基于GEVA-VC的企业业绩评价指标体系研究,F426.32
  14. 重庆文化产业竞争力研究,F224
  15. 基于改进粒子群算法的无功优化,TP301.6
  16. 声表面波气体传感器阵列模式识别技术的研究,TP212
  17. 黑河源区湿地动态变化分析及驱动力分析,P931.1
  18. 人类抗原肽载体结合力预测,R392.1
  19. 基于主成分分析法的我国沿海港口竞争力评价研究,F552
  20. 基于代数特征的民族面部特征研究,TP391.41
  21. 不确定环境下供应链多时段生产计划问题研究,F273

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com