学位论文 > 优秀研究生学位论文题录展示

基于多类特征融合的蛋白质亚线粒体定位预测研究

作 者: 樊国梁
导 师: 李前忠
学 校: 内蒙古大学
专 业: 生物物理学
关键词: 亚线粒体定位 化学位移 氨基酸黏性 支持向量机 离散增量 蛋白质相互作用
分类号: Q51
类 型: 博士论文
年 份: 2013年
下 载: 27次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着人类基因组计划的顺利进行,数据库中出现了大量的未知功能的蛋白质序列,分析这些未知功能的蛋白质成为当今的首要任务。目前,亚细胞定位作为分析蛋白质功能的手段达到了一定水平,人们开始关注亚细胞器定位研究,由于实验分析耗时、成本高,因此利用计算的方法来预测蛋白质亚细胞器定位成为当前研究的热点。本文系统的从蛋白质亚线粒体定位数据集的构建、特征参数的提取及优化、预测算法的建立以及算法的推广性等方面对蛋白质亚线粒体定位预测问题进行了研究,主要研究成果如下:1、蛋白质亚线粒体定位研究的数据集建立时间较早,包含的序列较少,我们构建了一个最新的蛋白质亚线粒体定位数据集,扩大了序列数。采用ID-SVM算法进行预测,取得较好的预测结果,同时对Du建立的数据集进行预测,在Jackknife检验下的总体预测成功率达到94.95%,比AC算法和DWT算法的总体预测成功率提高了5.3%和1.6%。2、在构建蛋白质化学位移数据集的基础上,通过分析蛋白质中20个氨基酸的二级结构与四种骨架原子的化学位移关系,发现每一种氨基酸的四种骨架原子的化学位移与二级结构有关联,呈现有规律的变化。通过化学位移的自相关算法来构建代表蛋白质的特征参数,应用在蛋白质亚线粒体定位中,达到目前最好预测结果。3、提出氨基酸黏性(stickiness)特征参数,利用该特征参数结合化学位移等信息参数对Du建立的数据集进行预测,Jackknife检验下的总体预测结果为96.21%,比我们之前的研究结果提高了1.26%,定位于matrix的蛋白质全部预测正确,对outer membrane的蛋白质预测成功率有所改善,Sn达到85.37%,提高了4.87%。4、建立了分歧杆菌蛋白质亚细胞定位数据集,并且用此数据集对我们提出的特征参数提取方式和预测算法进行推广性检测,得到较好的结果,Jackknife检验结果为94.00%,比Lin的方法高出2.8%,比Rashid的算法提高了11.3%,验证了我们算法有较强的推广性,可以应用到其他亚细胞定位问题上。5、建立了化学位移参数算法acACS服务网站(http://wlxy.imu.edu.cn/college/biostation/fuwu/acACS/index.asp)和亚线粒体数据集网站(http://wlxy.imu.edu.cn/college/biostation/fuwu/mito/index.asp),为生物信息学和蛋白质亚线粒体定位预测研究提供服务。

全文目录


摘要  4-6
ABSTRACT  6-8
目录  8-10
第一章 绪论  10-26
  1.1 研究背景和意义  10-13
  1.2 国内外研究现状及分析  13-20
    1.2.1 数据集  13-14
    1.2.2 研究方法  14-19
      1.2.2.1 物理化学性质(Submito)  14-15
      1.2.2.2 遗传算法(GP-Loc)  15-16
      1.2.2.3 自协方差算法(AC)  16-18
      1.2.2.4 小波分析(DWT)  18-19
    1.2.3 结果对比分析  19-20
  1.3 线粒体概述  20-24
    1.3.1 外膜(outer membrane)  22-23
    1.3.2 膜间隙(intermembrane space)  23
    1.3.3 内膜(inner membrane)  23
    1.3.4 嵴(cristae)  23-24
    1.3.5 基质(matrix space)  24
  1.4 论文研究内容及安排  24-26
第二章 特征提取及理论预测模型  26-50
  2.1 引言  26-27
  2.2 特征参数及提取方式  27-42
    2.2.1 氨基酸组分信息(Amino acid composition,AAC)  27-28
    2.2.2 二肽组分信息(Dipeptide composition,DC)  28-29
    2.2.3 约化的6种物理化学性质(Reduced physicochemical properties,H6)  29-30
    2.2.4 Gene ontology(GO)  30-31
    2.2.5 进化信息(PSSM)  31-33
    2.2.6 化学位移(Chemical shift)  33-39
      2.2.6.1 化学位移及其本质  33
      2.2.6.2 化学位移和蛋白二级结构关系  33-34
      2.2.6.3 化学位移数据集  34
      2.2.6.4 平均化学位移计算  34-37
      2.2.6.5 蛋白质的平均化学位移特征提取  37-38
      2.2.6.6 平均化学位移服务网站  38-39
    2.2.7 氨基酸黏性(protein stickiness)  39-42
      2.2.7.1 氨基酸黏性的定义  39-40
      2.2.7.2 氨基酸黏性  40-41
      2.2.7.3 氨基酸黏性特征参数提取  41-42
  2.3 预测算法  42-47
    2.3.1 离散增量算法  42-45
      2.3.1.1 离散量  42-43
      2.3.1.2 离散增量  43-44
      2.3.1.3 离散增量算法  44-45
    2.3.2 SVM算法  45-47
    2.3.3 融合算法  47
  2.4 算法评价  47-48
  2.5 小结  48-50
第三章 蛋白质亚线粒体定位预测  50-70
  3.1 引言  50-51
  3.2 数据集  51-59
    3.2.1 数据集的建立  51-52
    3.2.2 数据集对比分析  52-58
    3.2.3 数据集网站  58-59
  3.3 最优特征筛选  59-64
    3.3.1 AAC  59-60
    3.3.2 DC  60
    3.3.3 H6  60-61
    3.3.4 GO  61-62
    3.3.5 psePSSM  62-63
    3.3.6 acACS  63-64
  3.4 预测算法  64-66
    3.4.1 ID算法  64
    3.4.2 ID-SVM算法  64-66
  3.5 结果讨论  66-69
    3.5.1 预测结果对比分析  66-68
    3.5.2 结合氨基酸黏性的预测  68-69
  3.6 小结  69-70
第四章 讨论及其展望  70-78
  4.1 引言  70-71
  4.2 推广性检测  71-75
    4.2.1 数据集  71-72
    4.2.2 特征参数选取及算法  72-73
    4.2.3 预测结果  73-74
    4.2.4 结果对比分析  74
    4.2.5 结果讨论  74-75
  4.3 工作总结  75-76
  4.4 展望  76-78
参考文献  78-90
附录  90-98
致谢  98-99
攻读博士学位期间发表和完成的学术论文  99

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 基于支持向量机的故障诊断方法研究,TP18
  12. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  13. 棉花纤维初始发育期14-3-3相互作用蛋白的酵母双杂交筛选,S562
  14. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  15. 免疫共沉淀联合质谱筛选肝核因子HNF3β相互作用蛋白质及初步功能研究,R341
  16. 核蛋白NDP52与肿瘤坏死因子受体相关因子TRAF6相互作用及临床意义的研究,R363
  17. 基于车载3D加速传感器的路况监测研究,TP274
  18. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  19. 不匹配信道下耳语音说话人识别研究,TN912.34
  20. 基于文本挖掘的学者简历自动生成,TP391.1
  21. 基于特征选择的入侵检测研究,TP393.08

中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com