学位论文 > 优秀研究生学位论文题录展示

基于转录因子结合位点的特性对转录因子分类的新方法

作 者: 任良云
导 师: 张玉森
学 校: 山东大学
专 业: 运筹学与控制论
关键词: 转录因子 分类 转录因子结合位点 向量 支持向量机
分类号: Q75
类 型: 硕士论文
年 份: 2012年
下 载: 204次
引 用: 0次
阅 读: 论文下载
 

内容摘要


转录因子是控制基因表达第一阶段即DNA转录成RNA的一种蛋白质。它通过特异性结合调控区域的DNA序列来调控基因转录过程[1]。理解转录因子与结合位点间的相互作用是理解转录调控机制的关键。而根据转录因子的功能特性对转录因子进行准确的分类是研究转录因子功能的首要任务。本文提出了一种以转录因子结合位点特性来表示转录因子的方法,并以此用支持向量机对其进行分类,并取得很好的分类效果。本文主要有以下几个方面的成果:一、筛选了对于转录因子有代表性意义的转录因子结合位点的六个特性:转录因子结合位点的长度,新的位置频率值,不保守的转录因子结合位点的比率,非核小体位置的转录因子结合位点的比率,既保守又在核小体位置的转录因子结合位点比率,GC含量。二、统计了酵母菌和果蝇的转录因子对应的转录因子结合位点的六个特性,并以此构造了用于表示转录因子的向量。三、基于表示转录因子的向量用支持向量机的方法对酵母菌和果蝇的转录因子进行分类,并取得很好的分类结果。本文中提出的基于转录因子结合位点特性表示转录因子进而对转录因子分类的方法与已有的方法相比不仅准确率得到了提高,而且简单易行,且具有很好的生物学意义。

全文目录


摘要  8-9
ABSTRACT  9-10
前言  10-11
第1章 绪论  11-18
  1.1 转录因子(TF)与转录因子结合位点(TFBS)  11
  1.2 转录因子分类的研究意义  11-12
  1.3 转录因子分类的研究现状  12-14
    1.3.1 基于DNA结合域对转录因子分类  12-13
    1.3.2 基于转录起始的必要性对转录因子分类  13-14
  1.4 转录因子结合位点的识别特性  14-15
  1.5 用于转录因子分类的方法  15-18
    1.5.1 隐马尔可夫模型  16
    1.5.2 最近邻算法(NNA)  16-18
第2章 转录因子的向量表示  18-24
  2.1 转录因子结合位点的长度  18-19
  2.2 新的位置频率值  19-20
  2.3 不保守的转录因子结合位点的比率  20-21
  2.4 非核小体位置的转录因子结合位点的比率  21-22
  2.5 既保守又在核小体位置的转录因子结合位点比率  22
  2.6 GC含量  22-24
第3章 用支持向量机对转录因子分类  24-27
  3.1 支持向量机  24-25
  3.2 支持向量机在生物信息学中的应用  25
  3.3 支持向量机用于转录因子分类  25-27
第4章 实验  27-36
  4.1 实验数据来源  27-29
    (1) 转录因子结合位点的序列结构信息和位置信息  27
    (2) 转录因子结合位点所在DNA区域的保守性信息  27-28
    (3) 全基因组序列的核小体位置信息  28-29
  4.2 实验过程  29-33
  4.3 实验结果校验  33-36
    4.3.1 全检验法  33
    4.3.2 留一法交叉检验  33
    4.3.3 ROC曲线  33-36
第5章 总结和讨论  36-38
  5.1 总结  36
  5.2 讨论  36-38
参考文献  38-42
致谢  42-43
攻读学位期间发表的学术论文  43-44
学位论文评阅及答辩情况表  44

相似论文

  1. K公司计划及预测改进对于合理库存配置的研究,F224
  2. 多转录因子组合调控研究,Q78
  3. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  4. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  5. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  6. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  7. 音乐结构自动分析研究,TN912.3
  8. 基于词义及语义分析的问答技术研究,TP391.1
  9. 基于三维重建的焊点质量分类方法研究,TP391.41
  10. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  11. 基于串核的蛋白质分类算法的研究与实现,TP301.6
  12. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  13. 上下文相关的词汇复述研究,TP391.1
  14. 基于仿生模式识别的文本分类技术研究,TP391.1
  15. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  16. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  17. 基于停用词处理的汉语语音检索方法,TP391.1
  18. 基于图像的路面破损识别,TP391.41
  19. 多样性密度学习算法的研究与应用,TP181
  20. 基于支持向量机的故障诊断方法研究,TP18
  21. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183

中图分类: > 生物科学 > 分子生物学 > 分子遗传学
© 2012 www.xueweilunwen.com