学位论文 > 优秀研究生学位论文题录展示

基于朴素贝叶斯的piRNA识别问题研究

作 者: 张程
导 师: 王军
学 校: 上海师范大学
专 业: 基础数学
关键词: 机器学习方法 朴素贝叶斯分类器 特征构建
分类号: Q522
类 型: 硕士论文
年 份: 2013年
下 载: 25次
引 用: 0次
阅 读: 论文下载
 

内容摘要


piRNA的识别是目前生物信息学领域研究的热点问题之一。piRNA,又称Piwi-interacting RNA是一类重要的非编码小RNA,其长度大约是25到32个核苷酸,可以和Piwi蛋白结合形成piRNA复合物,并且与RNA沉默作有关。目前对于非编码RNA的研究工作主要分为两个方面,一是大规模非编码RNA的鉴定,主要借助于计算机,从已有的非编码RNA中提取特征信息,然后将特征信息进行全基因组尺度的识别;二是采用基因组学和实验方法研究非编码RNA的功能。本文以人类、小鼠、大鼠、果蝇等模式生物作为研究对象,通过搜集现有经实验验证的piRNA序列构建训练集合,分别构建了基于核苷酸组分和物理化学性质分类的多种特征表示模型,并采用朴素贝叶斯分类器结合5轮交叉检验的方法进行预测。最后对各种模型的预测结果进行了比较。结果表明k-mer频率结合核苷酸分类的特征组合模型得到了较好的预测性能,总准确度达到82%多,高于k-mer频率等的特征模型。本文的主要内容安排如下:第一章简述生物信息学的主要研究内容及本文的主要工作;第二章概述非编码RNA的分类预测问题的背景和研究现状;第三章介绍常见的特征构建机器学习方法,包括k-mer法、核苷酸分类的特征表示方法、K-2阶马尔科夫模型等;第四章介绍本文的主要工作——基于朴素贝叶斯的piRNA的识别问题研究;第五章总结及未来展望。

全文目录


中文摘要  4-5
Abstract  5-7
第一章 绪论  7-9
  1.1 生物信息学的介绍  7-8
  1.2 本文的主要工作  8-9
第二章 非编码小RNA分类预测问题概述  9-12
  2.1 非编码RNA的研究现状  9-12
    2.1.1 非编码RNA的分类及其作用  9-10
    2.1.2 非编码RNA的研究意义  10
    2.1.3 非编码RNA预测研究现状  10-12
第三章 特征构建方法和分类器  12-23
  3.1 序列特征的构建方法  12-14
    3.1.1 k-mer法  12-13
    3.1.2 基于核苷酸分类的特征表示方法  13-14
  3.2 分类器  14-23
    3.2.1 朴素贝叶斯分类器  14-15
    3.2.2 贝叶斯网络  15-16
    3.2.3 支持向量机  16-19
    3.2.4 K-最近邻法  19-20
    3.2.5 神经网络  20-23
第四章 piRNA分类预测问题  23-36
  4.1 piRNA的研究状况  23-25
    4.1.1 piRNA的发现及其生物学功能  23-25
    4.1.2 piRNA研究的意义  25
  4.2 研究序列数据集的说明  25-27
    4.2.1 数据来源  25
    4.2.2 序列特征构建  25-27
  4.3 使用朴素贝叶斯预测的实现  27-30
    4.3.1 输入数据的格式  29
    4.3.2 参数试验  29-30
    4.3.3 5-轮交叉检验  30
    4.3.4 预测过程  30
  4.4 实验结果与分析  30-36
第五章 总结与展望  36-37
在校期间科研成果  37-38
致谢  38-39
参考文献  39-41

相似论文

  1. 贝叶斯分类算法的研究与应用,TP18
  2. 面向工程监理的多Agent信息智能检索机制研究,TP391.3
  3. 基于N-Gram模型的藏文文本分类技术研究,TP391.1
  4. 有监督方法在词义消歧中的应用,TP391.1
  5. 基于Copula理论的两种分类算法研究,TP181
  6. 基于最优分割策略的高性能文本分类方法,TP18
  7. 贝叶斯网络中不确定性知识推理算法及其应用研究,TP183
  8. 大学优秀班集体的特征和构建研究,G641
  9. 基于模式识别和集成学习的电力系统暂态稳定评估,TM712
  10. 监督学习下的贝叶斯分类器研究,TP18
  11. 基于多属性关联改进文本分类算法,TP391.1
  12. 基于分段信息融合的蛋白质亚细胞位点测方法,Q51
  13. 几起附条件不起诉案件的法理分析,D925.2
  14. 基于知识型数据的监督学习,TP18
  15. 基于增量式朴素贝叶斯分类方法的电梯交通模式识别方法的研究,TP391.4
  16. 贝叶斯方法在化工软测量建模中的应用研究,TP274
  17. 基于特征选择集成算法的乳腺癌辅助检测研究,R737.9
  18. 朴素贝叶斯分类器在入侵检测应用的研究,TP393.08
  19. 覆盖算法的增量学习研究,TP181
  20. 朴素贝叶斯分类器的研究与应用,TP181
  21. 城市交通拥堵状态自动判别方法研究,U495

中图分类: > 生物科学 > 生物化学 > 核酸 > 核糖(醣)核酸(RNA)
© 2012 www.xueweilunwen.com