学位论文 > 优秀研究生学位论文题录展示

基于条件随机场的RNA二级结构预测算法

作 者: 李阳
导 师: 祝烈煌;宋丹丹
学 校: 北京理工大学
专 业: 生物医学工程
关键词: 计算生物学 RNA二级结构预测 条件随机场 随机上下文无关文法
分类号: R346
类 型: 硕士论文
年 份: 2011年
下 载: 33次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着越来越多的非编码基因及功能被识别和揭示,人们逐渐认识到非编码RNA的重要性。由于其结构决定功能,研究RNA的二级结构有着非常重要的意义。非编码RNA基因的数目的庞大以及生物实验的局限性,使得二级结构预测成为非编码RNA识别及其功能研究的重要途径。RNA序列的研究方法主要有两个大的方向,分别是基于多序列比较分析方法的RNA二级结构预测方法和基于单序列的RNA二级结构预测方法。本论文重点介绍单序列的处理方法:最大碱基配对数算法和基于最小自由能算法,它们是确定性动态规划类算法,但未能很好的解决伪结和准确性问题;同样介绍了基于概率论的隐马尔可夫模型(HMM)和随机上下文无关文法(SCFG),这两个算法则存在着数据归纳偏置的问题,并且存在较高的计算复杂度。条件随机场(CRFs)在图像标注、文本标注等领域应用良好,并在预测同源RNA序列的共有结构时处理的结果较好。本论文研究就是在已知一条RNA的序列编码信息之后,通过条件随机场模型方法来计算出该RNA序列的二级结构。本研究针对单个RNA序列二级结构预测中传统算法的不足,结合CRFs模型,通过改变传统的基于概率模型中严格的条件独立性假设,并在其中加入通过长期研究得到的先验知识,可以很好的解决数据归纳偏置及准确性的问题,得到理想的RNA二级结构。

全文目录


摘要  5-6
Abstract  6-10
第一章 绪论  10-16
  1.1 引言  10-12
  1.2 研究背景  12-14
    1.2.1 RNA 的测序  12-13
    1.2.2 RNA 的功能研究  13-14
  1.3 论文内容及结构安排  14-16
第二章 RNA 二级结构预测基础  16-22
  2.1 RNA 的生物学背景  16-18
  2.2 RNA 的二级结构概念  18-21
  2.3 本章小结  21-22
第三章 RNA 的二级机构预测方法  22-36
  3.1 基于比较序列分析模型方法  22-24
  3.2 单RNA 序列分析模型方法  24-34
    3.2.1 隐马尔可夫模型模型  25-29
    3.2.2 最大碱基配对算法  29-30
    3.2.3 最小自由能法  30-31
    3.2.4 随机上下文无关文法模型  31-34
  3.3 本章小结  34-36
第四章 基于条件随机场的RNA 二级结构预测  36-53
  4.1 条件随机场模型  36-38
  4.2 基于条件随机场的RNA 二级结构预测  38-48
    4.2.1 特征函数选取  38-39
    4.2.2 模型训练  39-48
  4.3 实验结果  48-51
    4.3.1 序列的选择  48-49
    4.3.2 参数的选择  49
    4.3.3 实验结果及分析  49-51
  4.4 本章小结  51-53
第五章 总结与展望  53-56
致谢  56-57
参考文献  57-60

相似论文

  1. 基于条件随机场的中文分词技术的研究与实现,TP391.1
  2. 基于空间邻域词袋模型的图像标注技术,TP391.41
  3. 基于树型条件随场的特定域事件提取方法研究,TP391.1
  4. 基于字词联合解码的中文分词研究,TP391.1
  5. 特定领域中文术语抽取,TP391.1
  6. 中文命名实体识别与歧义消解研究,TP391.1
  7. 保罗·M·丘奇兰德的神经科学哲学思想研究,B842.1
  8. 中文命名实体识别及若干相关问题的研究,TP391.41
  9. 基于信息抽取技术的商业社会网络创建研究,TP391.1
  10. 基于条件随机场的中文命名实体识别研究,TP391.4
  11. 基于条件随机场的中文命名实体识别,TP391.43
  12. 本地搜索领域POI缩略词词典的研究,TP391.3
  13. 基于条件随机场的汉语短语识别研究,TP391.1
  14. 基于规则与统计的语气词用法自动识别研究,TP391.1
  15. 产品名实体识别及规范化研究,TP391.1
  16. 人脸表情识别及其在视频分类与推荐中的应用,TP391.41
  17. 面向产品领域的细粒度情感分析技术,TP391.1
  18. 语义角色标注的集成策略的研究,TP391.1
  19. 领域本体概念实例、属性及属性值提取研究,TP391.1
  20. 基于SSH和Lucene垂直搜索引擎研究,TP391.3

中图分类: > 医药、卫生 > 基础医学 > 人体生物化学、分子生物学
© 2012 www.xueweilunwen.com