学位论文 > 优秀研究生学位论文题录展示

基于特征融合的膜蛋白跨膜螺旋预测

作 者: 谌贻华
导 师: 於东军
学 校: 南京理工大学
专 业: 计算机软件与理论
关键词: 特征融合 膜蛋白 跨膜螺旋 蛋白结构预测
分类号: Q51
类 型: 硕士论文
年 份: 2012年
下 载: 15次
引 用: 0次
阅 读: 论文下载
 

内容摘要


二十世纪九十年代,随着人类基因组计划的开展,极大地促进了基因组学和蛋白质组学的发展,人们获得了海量的氨基酸残基序列和蛋白质序列。但在蛋白序列数据迅猛增长的同时,蛋白质结构测定却显得相对滞后。膜蛋白约占整个蛋白质序列的30%,但却仅有1%的膜蛋白结构被测定出来。膜蛋白作为细胞膜的一部分,其已知的作为细胞间通信、调节细胞膜内外溶质与离子传输、细胞的“感觉器官”等功能在维持生物体正常运转中起着重要作用。由于蛋白质结构与功能之间密切的关系,如果能测得蛋白质的结构,那么就可以在一定程度上推断它具有的功能。膜蛋白受体作为绝大多数药物靶点,如能预先测得其结构特征,那么在新药物的研制过程中必会产生巨大的效益。本文主要研究预测膜蛋白跨膜螺旋。目前,基于特定位置得分矩阵(position-specific scoring matrix, PSSM)的膜蛋白跨膜螺旋预测取得了比较好的结果。但是使用PSSM进行膜蛋白跨膜螺旋预测仅仅使用了序列进化信息,膜蛋白还有许多其他的物理化学性质也可以应用到跨膜螺旋预测中来。典型的如氨基酸的疏水性、分布倾向性都曾经作为基础信息用于跨膜螺旋预测。本文的中心思想是以PSSM为基础,分别引入氨基酸的疏水性、结构倾向性、分布倾向性并观察预测结果。具体做法是使用主成分分析(principal component analysis, PCA)对PSSM进行特征提取,获得包含序列进化信息的特征,并以此为基础,分别加入结构倾向性、疏水性、分布倾向性特征,应用特征融合的方法,对膜蛋白跨膜螺旋区域进行分类预测,得到了较好的预测结果。标准数据集上的实验结果表明,本文基于多特征融合的方法在预测精度的五类评价指标上均有提升,特别是在末端准确率上提高明显,是一种有效的膜蛋白跨膜螺旋预测方法。

全文目录


摘要  3-4
Abstract  4-5
目录  5-7
1. 绪论  7-13
  1.1. 引言  7
  1.2. 研究的背景  7-11
    1.2.1. 生物信息学研究及其进展  7-8
    1.2.2. 蛋白质的结构模型  8
    1.2.3. 蛋白质序列分析的主要内容  8-9
    1.2.4. 蛋白质二级结构预测  9-10
    1.2.5. 膜蛋白及其结构预测研究  10-11
  1.3. 本文研究的主要内容  11
  1.4. 论文的组织与结构  11-13
2. 膜蛋白结构与预测  13-27
  2.1. 蛋白质概述  13-14
  2.2. 蛋白质的结构层次  14-15
    2.2.1. 蛋白质一级结构  14
    2.2.2. 蛋白质的空间结构  14-15
  2.3. 蛋白质结构测定  15
  2.4. 蛋白质二级结构预测的经验参数方法  15-19
  2.5. 膜蛋白概述  19
  2.6. 膜蛋白分类  19-22
    2.6.1. 内在膜蛋白  20
    2.6.2. 外周蛋白  20-21
    2.6.3. 脂锚定蛋白  21
    2.6.4. 膜蛋白六分类模型  21-22
  2.7. 膜蛋白功能  22-23
  2.8. 膜蛋白结构预测  23-25
  2.9. 本章小结  25-27
3. 基于特征融合跨膜螺旋预测  27-44
  3.1. 氨基酸特征提取  27-36
    3.1.1. 特定位置得分矩阵(PSSM)  27-28
    3.1.2. 主成分分析(PCA)  28-29
    3.1.3. PSSM特征提取与进化信息特征  29-30
    3.1.4. 氨基酸疏水性特征  30-32
    3.1.5. 氨基酸结构倾向性与螺旋倾向性特征  32-34
    3.1.6. 氨基酸分布偏好性与跨膜末端倾向性特征  34-35
    3.1.7. 特征融合  35-36
  3.2. 预测模型建立  36-41
    3.2.1. 朴素贝叶斯分类算法  36
    3.2.2. 决策树分类算法  36-37
    3.2.3. KNN分类算法  37-39
    3.2.4. 分类算法评价(交叉验证)  39-40
    3.2.5. 分类算法选择  40-41
  3.3. OET-KNN分类模型  41-42
  3.4. 预测模型算法流程  42-43
  3.5. 本章小结  43-44
4. 实验过程与结果分析  44-55
  4.1. 数据来源  44-45
    4.1.1. SWISS-PROT数据库  44
    4.1.2. PDB  44-45
  4.2. 标准数据集  45-47
  4.3. 预测结果评价标准  47-48
  4.4. 预测结果与性能分析  48-54
  4.5. 本章小结  54-55
5. 总结与展望  55-57
  5.1. 全部工作总结  55-56
  5.2. 以后工作展望  56-57
致谢  57-58
参考文献  58-62
附录  62

相似论文

  1. 唇读中的特征提取、选择与融合,TP391.41
  2. 羊种布鲁氏菌16M优势蛋白抗原的鉴定,S852.61
  3. 水稻抗稻瘟病菌质膜蛋白的蛋白质组学分析,S511
  4. 白斑综合征病毒(WSSV)重复单元ORF94的序列差异分析及囊膜蛋白的相互作用,S945.1
  5. 水下目标特征的压缩与融合技术研究,TN911.7
  6. 结核分枝杆菌WecA膜蛋白的表达和功能分析,R378
  7. 犬小孢子菌膜蛋白PQ-LRP基因全长cDNA的克隆,R758.6
  8. 基于支持向量机的视频目标检测方法研究,TP391.41
  9. 指纹图像分割方法研究,TP391.41
  10. 基于特征融合的人脸识别算法研究,TP391.41
  11. 膜蛋白跨膜螺旋结构预测研究,Q51
  12. 基于信息融合的模拟电路故障诊断研究,TN710
  13. 非重叠监控摄像机中行人关联技术研究,TP391.41
  14. 新生儿重症监护病房多重耐药鲍曼不动杆菌耐药机制及同源性研究,R446.5
  15. 基于特征融合的目标识别技术的研究,TP391.41
  16. 钴结壳的非线性超声识别技术研究,TN912.34
  17. HIV病毒包膜蛋白gp120与结核分枝杆菌感染人巨噬细胞的比较研究,R378
  18. 膜蛋白分类的特征提取算法和数据集构建技术研究,Q51
  19. 大鼠海马细胞质膜蛋白质组学研究及二维色谱在毒素组学研究中的应用,Q51
  20. 鼻咽癌细胞系质膜蛋白质组学研究,R739.63

中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com