学位论文 > 优秀研究生学位论文题录展示
基于条件随机场的RNA二级结构预测算法
作 者: 李阳
导 师: 祝烈煌;宋丹丹
学 校: 北京理工大学
专 业: 生物医学工程
关键词: 计算生物学 RNA二级结构预测 条件随机场 随机上下文无关文法
分类号: R346
类 型: 硕士论文
年 份: 2011年
下 载: 33次
引 用: 0次
阅 读: 论文下载
内容摘要
随着越来越多的非编码基因及功能被识别和揭示,人们逐渐认识到非编码RNA的重要性。由于其结构决定功能,研究RNA的二级结构有着非常重要的意义。非编码RNA基因的数目的庞大以及生物实验的局限性,使得二级结构预测成为非编码RNA识别及其功能研究的重要途径。RNA序列的研究方法主要有两个大的方向,分别是基于多序列比较分析方法的RNA二级结构预测方法和基于单序列的RNA二级结构预测方法。本论文重点介绍单序列的处理方法:最大碱基配对数算法和基于最小自由能算法,它们是确定性动态规划类算法,但未能很好的解决伪结和准确性问题;同样介绍了基于概率论的隐马尔可夫模型(HMM)和随机上下文无关文法(SCFG),这两个算法则存在着数据归纳偏置的问题,并且存在较高的计算复杂度。条件随机场(CRFs)在图像标注、文本标注等领域应用良好,并在预测同源RNA序列的共有结构时处理的结果较好。本论文研究就是在已知一条RNA的序列编码信息之后,通过条件随机场模型方法来计算出该RNA序列的二级结构。本研究针对单个RNA序列二级结构预测中传统算法的不足,结合CRFs模型,通过改变传统的基于概率模型中严格的条件独立性假设,并在其中加入通过长期研究得到的先验知识,可以很好的解决数据归纳偏置及准确性的问题,得到理想的RNA二级结构。
|
全文目录
摘要 5-6 Abstract 6-10 第一章 绪论 10-16 1.1 引言 10-12 1.2 研究背景 12-14 1.2.1 RNA 的测序 12-13 1.2.2 RNA 的功能研究 13-14 1.3 论文内容及结构安排 14-16 第二章 RNA 二级结构预测基础 16-22 2.1 RNA 的生物学背景 16-18 2.2 RNA 的二级结构概念 18-21 2.3 本章小结 21-22 第三章 RNA 的二级机构预测方法 22-36 3.1 基于比较序列分析模型方法 22-24 3.2 单RNA 序列分析模型方法 24-34 3.2.1 隐马尔可夫模型模型 25-29 3.2.2 最大碱基配对算法 29-30 3.2.3 最小自由能法 30-31 3.2.4 随机上下文无关文法模型 31-34 3.3 本章小结 34-36 第四章 基于条件随机场的RNA 二级结构预测 36-53 4.1 条件随机场模型 36-38 4.2 基于条件随机场的RNA 二级结构预测 38-48 4.2.1 特征函数选取 38-39 4.2.2 模型训练 39-48 4.3 实验结果 48-51 4.3.1 序列的选择 48-49 4.3.2 参数的选择 49 4.3.3 实验结果及分析 49-51 4.4 本章小结 51-53 第五章 总结与展望 53-56 致谢 56-57 参考文献 57-60
|
相似论文
- 基于条件随机场的中文分词技术的研究与实现,TP391.1
- 基于空间邻域词袋模型的图像标注技术,TP391.41
- 基于树型条件随场的特定域事件提取方法研究,TP391.1
- 基于字词联合解码的中文分词研究,TP391.1
- 特定领域中文术语抽取,TP391.1
- 中文命名实体识别与歧义消解研究,TP391.1
- 保罗·M·丘奇兰德的神经科学哲学思想研究,B842.1
- 中文命名实体识别及若干相关问题的研究,TP391.41
- 基于信息抽取技术的商业社会网络创建研究,TP391.1
- 基于条件随机场的中文命名实体识别研究,TP391.4
- 基于条件随机场的中文命名实体识别,TP391.43
- 本地搜索领域POI缩略词词典的研究,TP391.3
- 基于条件随机场的汉语短语识别研究,TP391.1
- 基于规则与统计的语气词用法自动识别研究,TP391.1
- 产品名实体识别及规范化研究,TP391.1
- 人脸表情识别及其在视频分类与推荐中的应用,TP391.41
- 面向产品领域的细粒度情感分析技术,TP391.1
- 语义角色标注的集成策略的研究,TP391.1
- 领域本体概念实例、属性及属性值提取研究,TP391.1
- 基于SSH和Lucene垂直搜索引擎研究,TP391.3
中图分类: > 医药、卫生 > 基础医学 > 人体生物化学、分子生物学
© 2012 www.xueweilunwen.com
|