学位论文 > 优秀研究生学位论文题录展示

基于序列信息的转录因子结合位点和启动子理论预测

作 者: 杨科利
导 师: 李前忠
学 校: 内蒙古大学
专 业: 生物物理学
关键词: 转录因子结合位点 启动子 位置权重矩阵 离散增量 支持向量机
分类号: Q75
类 型: 硕士论文
年 份: 2007年
下 载: 352次
引 用: 1次
阅 读: 论文下载
 

内容摘要


基因转录调控一直是生物信息学研究的一个重要内容,转录因子结合位点启动子的识别是研究基因转录调控的重要环节,是构建基因调控网络的一个核心问题。本文基于已知的转录因子结合位点和启动子序列数据,从序列信息出发,提出了整合位点保守型参量和位置权重矩阵预测转录因子结合位点的位置权重矩阵打分函数方法以及联合位置权重矩阵和离散增量预测启动子的支持向量机方法。基于转录因子结合位点序列通常比较短且保守,引入矩阵模型描述转录因子结合位点的特性,同时依据转录因子结合位点的位点保守性各不相同,将碱基保守性参数引入矩阵模型,从而提出预测转录因子结合位点的位置权重打分函数算法(PWMSA)。首先将四种碱基随机出现的频率作为背景频率,以单碱基位点保守性参量结合单碱基位置权重矩阵的PWMSA算法对22种转录因子结合位点进行预测,总体Self-consistency检验为87.59%,10-fold cross-validation检验为85.48%。然后考虑到基因序列中的四种碱基并非随机出现,以四种碱基实际出现的频率作为背景频率,用PWMSA算法对酵母九种转录因子结合位点进行预测,Self-consistency检验预测成功率达83.14%,10-fold cross-validation检验预测成功率为77.51%。同时,引进两种最新的评价指标,将PWMSA算法与现有的10种预测转录因子结合位点的软件进行比较,结果表明PWMSA算法的评价指标均高于现有的算法,在核苷酸和结合位点片段两种评价水平上,预测成功率分别高出其他算法4%,7%个百分点。考虑到转录因子结合位点之间存在碱基相互作用共同贡献与蛋白的亲和力,利用已知的9种酵母转录因子结合位点序列构建近邻核苷酸二联体位置权重矩阵,计算位点近邻二联体核苷酸保守性参量,使用PWMSA算法对9种酵母转录因子结合位点进行预测,Self-consistency检验和10-fold cross-validation检验预测成功率分别达到88.04%,81.10%,明显高于单碱基位置权重矩阵的结果。基于启动子序列的内容特征和信号特征与非启动子序列的区别,利用离散量方法提取启动子序列的内容特征;构建核心启动子元件的位置权重矩阵,使用位置权重矩阵提取启动子序列的信号特征,最后提取启动子和非启动子序列碱基组份特征。构建了基于综合启动子序列的内容特征和信号特征预测启动子序列的支持向量机分类器,并对人类PolⅡ启动子进行预测,10-fold cross-validation检验为95.70%,对另外选取的独立测试集预测成功率为98.30%,同时与现有的7种预测启动子的软件和算法进行比较,我们的算法预测成功率敏感性为97.00%,特异性为97.98%,结果明显优于现有的预测算法和软件。

全文目录


摘要  4-6
ABSTRACT  6-9
一 引言  9-14
  (一)、转录因子结合位点启动子的研究意义  9-11
  (二)、当前理论研究现状  11-14
二 基于序列信息的转录因子结合位点理论预测  14-36
  (一)、基于单碱基位置权重矩阵预测转录因子结合位点  14-30
    1 大肠杆菌E.coli K-12转录因子结合位点的预测  14-22
      1.1 数据库  14
      1.2 算法过程  14-19
      1.3 结果  19-22
    2 酵母转录因子结合位点的预测  22-30
      2.1 数据库  22-23
      2.2 算法过程  23-25
      2.3 结果  25-27
      2.4 结果评价与算法比较  27-30
  (二)、基于近邻二联体权重矩阵预测转录因子结合位点  30-36
    1 数据库  30-31
    2 算法过程  31-32
    3 结果  32-34
    4 结果评价与算法比较  34-36
三 基于序列信息的启动子理论预测  36-42
  1 理论方法  36-38
  2 数据库  38
  3 算法过程  38-39
  4 结果讨论  39-42
参考文献  42-49
致谢  49-50
攻读硕士学位期间发表的学术论文  50

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 基于支持向量机的故障诊断方法研究,TP18
  12. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  13. 水稻茎叶特异表达基因启动子的筛选及分析,S511
  14. 猪BMP7基因启动子多态性及其与繁殖性状关联性分析,S828
  15. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  16. 水稻纹枯病菌三磷酸甘油醛脱氢酶基因的克隆及其遗传转化体系的构建,S435.111.42
  17. Pib结构基因在不同启动子驱动下的稻瘟病抗性,S435.111.41
  18. 水稻Pib启动子中乙烯和茉莉酸响应元件的转基因分析,S511
  19. J亚型禽白血病病毒抗体检测方法的建立及LTR体外启动活性分析,S858.31
  20. 棉铃虫细胞色素P450基因CYP9A17v2启动子活性分析,S435.622
  21. Pib基因启动子3’端缺失体的暗诱导特性分析,S511

中图分类: > 生物科学 > 分子生物学 > 分子遗传学
© 2012 www.xueweilunwen.com