学位论文 > 优秀研究生学位论文题录展示

定量序效模拟

作 者: 周鹏
导 师: 李志良
学 校: 重庆大学
专 业: 药物化学
关键词: 定量序效模拟 定量构效关系 VBPV表征子 氨基酸广义疏水标度 三维原子场全息作用矢量 虚拟疫苗库 核序列自相关函数 主成分分析 偏最小二乘回归 遗传算法 HLA限制性CTL表位 疏水作用色谱
分类号: R91
类 型: 硕士论文
年 份: 2007年
下 载: 101次
引 用: 1次
阅 读: 论文下载
 

内容摘要


定量序效模拟(QSAM)是定量构效关系(QSAR)研究的一个新颖的分支学科,它主要从生物分子一级序列出发定量研究结构与活性(性质)之间的内在联系,并给出恰当的函数描述,从而达到对未知目标功能预测及指导结构修饰和改造等目的。本文从QSAM方法学研究入手,分别在肽/蛋白质和核酸序列单元及整体结构表征方法、配基-受体作用模式、虚拟疫苗库设计、疏水作用色谱保留行为模拟、蛋白质高级结构预测理论等方面进行了试探性研究,取得了一定成果。这些工作主要包括以下几个方面:①从天然碱基的36种性质参数出发,通过主成分分析(PCA)技术处理得到了一个显著的主成分得分,并将该得分作为单个碱基的信息描述子:VBPV。进而使用VBPV对38个大肠杆菌(E.coli)启动子序列一级结构进行表征,并结合多元统计方法将表征参数与转录启动强度(PS)成功地建立了定量序列-活性模型(QSAM),该模型拟合复相关系数r与交叉检验复相关系数q分别为0.9712和0.9515。在此基础上对靶标序列进行了定点改造,得到了5条具有潜在启动活性的新型E.coli启动子序列,该结果有待进一步实验验证。②使用天然氨基酸149个疏水性质经主成分分析得到了一种新氨基酸描述子:氨基酸广义疏水标度(GH-scale)。进而使用GH-scale结合遗传偏最小二乘(GA-PLS)算法对152个HLA-A*0201限制性CTL表位进行定量构效关系(QSAR)研究。所建模型拟合及交叉检验复相关系数分别为r2=0.813和q2=0.725。研究表明疏水作用在CTL表位与HLA-A*0201结合过程中扮演极其重要角色,而锚定残基是该类作用发生最显著的部位。③将有机化合物中常见的原子按元素周期表的族和杂化状态进行分类,通过计算药物分子内部不同类型原子之间的三类非键相互作用(静电、立体和疏水)得到一种新的旋转平移不变性3D分子结构表征方法方法:三维原子场全息作用矢量(3D-HoVAIF)。本文中采用3D-HoVAIF对58个血管紧张素转化酶(ACE)抑制剂和48个苦味二肽进行了系统的QSAR研究,所得GA-PLS模型的r2, q2, RMSEE和RMSCV分别为0.857, 0.811, 0.376和0.432和0.940, 0.892, 0.153和0.205,该结果优于多数文献报道。采用D-optimal技术将两组样本平分为内部训练集和外部测试集两部分,在此基础上对3D-HoVAIF进行严格的统计检验,并将其与两类典型的肽序列表征方法(z-scale和ISA-ECI)加以对比研究,结果较为满意。进一步采用所建模型对400个理论上可能存在的二肽分子的ACE抑制活性和苦味阀值进行预测,通过相关性分析发现二肽类物质的ACE抑制活性与苦味强度呈现出显著的正相关关系,因此难以找到同时具备优良药效(ACE抑制活性较高)且口感舒适(苦味较低)的二肽化合物,可认为采用二肽作为降血压类功能食品的有效成分并不理想。④通过定义HLA-A*0201限制性CTL表位序列各个位点与HLA-A*0201蛋白分子直接接触残基类型以及配基与受体之间的数种非键效应计算公式,进而构建了CTL表位-HLA-A*0201的4类非键作用矩阵,在此基础上提出并应用基于结构的定量构效关系(SBQSAR)方法研究了266个HLA-A*0201限制性CTL表位序列与活性之间的关系,所得GA-PLS模型与文献报道及分子图形学显示情况符合良好。研究发现疏水作用和氢键在抗原识别及呈递过程中扮演着重要的角色,并且这两类非键效应在抗原肽锚定残基处表现较为突出。⑤给出了基于定量序效模型的计算机辅助虚拟疫苗库设计方案,并以此为基础成功设计了一个合理规模的HLA-A*0201限制性CTL表位(抗原肽)库,其实现流程如下:1)从天然氨基酸516种理化性质经主成分分析(PCA)得到了一种新的氨基酸描述子:氨基酸综合性质得分(SP-score);2)基于SP-score结合遗传-偏最小二乘(GA-PLS)技术建立定量序效模型(QSAM);3)利用QSAM模型作为评价工具采用遗传算法(GA)优化CTL表位种群;4)统计优秀种群中20种氨基酸分别在抗原肽序列上不同位置的出现频率f;5)保留f>F(F为随机平均出现概率,对于任意氨基酸为1/20)的氨基酸作为该位置的有利残基类型参与虚拟组合库的构建。⑥将蛋白质与疏水作用色谱(HIC)固定相相互作用分为直接非键/构象作用和蛋白质表面疏水效应两个热力学过程,从而定量给出了处于浓盐析盐水溶液中HIC保留时间与配基/蛋白质结合自由能之间的二元线性关系。在此基础上通过ICM柔性分子对接策略及遗传算法(对27个已知晶体结构的蛋白质与疏水配基的可能结合方式进行模拟和分析,所得结果与实验观测情况符合良好。研究表明蛋白质局部疏水效应以及配基与蛋白质的非键/构象作用皆对HIC色谱保留行为影响显著,且作用区域多集中于蛋白质表面突出部位。⑦采用SP-score对蛋白质一级序列进行矢量化描述,并以此定义基于向量形式的自相关函数以及引入Mercer核技术将该函数运算空间进行非线性变换,最终构造了一种新的蛋白质序列表征方法:核序列自相关函数(KSACF)。采用该函数对632个已知晶体结构的非同源蛋白分类研究结果表明:KSACF能够恰当提取蛋白质一级序列特征以及氨基酸残基之间隐含的内在联系,从而对不同蛋白质结构类进行准确模拟和预测。

全文目录


摘要  3-5
ABSTRACT  5-10
1 绪论  10-16
  1.1 定量序效模拟的学科位置  10-12
  1.2 定量序效模拟的定义  12
  1.3 定量序效模拟的发展  12-14
  1.4 本文框架  14-16
2 统计建模工具及模型诊断  16-24
  2.1 多元线性回归  16-17
  2.2 主成分分析  17-18
  2.3 偏最小二乘回归  18-19
  2.4 遗传算法  19-21
  2.5 模型诊断  21-24
3 碱基表征子  24-32
  3.1 概述  24
  3.2 碱基表征子的提出  24-26
  3.3 建模及分析  26-29
  3.4 启动子改造  29-30
  3.5 小结  30-32
4 氨基酸广义疏水标度  32-44
  4.1 概述  32
  4.2 氨基酸广义疏水标度的提出  32-37
  4.3 QSAM 建模及分析  37-43
  4.4 小结  43-44
5 三维原子场全息相互作用矢量  44-60
  5.1 概述  44-45
  5.2 三维原子场全息相互作用矢量的提出  45-46
  5.3 QSAM 建模及分析  46-56
  5.4 二肽苦味强度与ACE 抑制活性之间的相关性分析  56-59
  5.5 小结  59-60
6 基于结构的定量序效模拟  60-76
  6.1 概述  60-61
  6.2 基于结构的定量序效模拟的提出  61-65
  6.3 HLA-A*0201 限制性CTL 表位集  65-68
  6.4 QSAM 建模及分析  68-73
  6.5 小结  73-76
7 基于定量序效模型的计算机辅助虚拟疫苗库设计  76-86
  7.1 概述  76-77
  7.2 氨基酸综合性质得分  77-78
  7.3 虚拟疫苗库设计流程  78-79
  7.4 QSAM 模型分析  79-81
  7.5 虚拟组合疫苗库实现  81-83
  7.6 小结  83-86
8 分子对接模拟蛋白质色谱保留行为  86-96
  8.1 概述  86-87
  8.2 理论分析  87-88
  8.3 柔性分子对接  88-89
  8.4 氨基酸疏水参数  89-90
  8.5 实验部分  90-91
  8.6 模拟过程  91-92
  8.7 结果及分析  92-95
  8.8 小结  95-96
9 核序列自相关函数  96-106
  9.1 概述  96-97
  9.2 核序列自相关函数的提出  97-99
  9.3 Bayes 判别法  99-100
  9.4 蛋白质数据集  100-101
  9.5 结果及分析  101-104
  9.6 小结  104-106
10 结论与展望  106-112
  10.1 研究结论  106-109
  10.2 思考和展望  109-112
致谢  112-114
参考文献  114-130
附录  130

相似论文

  1. 天然气脱酸性气体过程中物性研究及数据处理,TE644
  2. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  3. 基于质谱的雷公藤甲素肝脏毒性代谢组学研究,R285
  4. 改进的主成分分析方法在学科建设中的应用,G642.4
  5. 基于遗传算法的模糊层次综合评判在高职教学评价中的应用,G712
  6. 部队人员网上训练与考核系统的开发,TP311.52
  7. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  8. 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
  9. 基于遗传算法的中短波磁天线的设计及实现,TN820
  10. 基于遗传算法的柑橘图像分割,TP391.41
  11. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  12. 基于遗传—牛顿算法的公交优化调度,TP18
  13. 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
  14. 基于云理论和蜜蜂进化型遗传算法的纹理合成研究,TP391.41
  15. 基于遗传算法和粗糙集的聚类算法研究,TP18
  16. 朝阳地区参考作物腾发量演变特征与预测模型研究,S161.4
  17. 高分辨率SAR影像裸土信息提取及土壤含水量反演初探,S152.7
  18. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  19. 旅游对芦芽山国家级自然保护区典型植被的影响,S759.9
  20. 太行山猕猴掌面花纹嵴数的形态学研究,Q954
  21. 赵官煤矿下组煤底板突水预测及防治技术研究,TD745

中图分类: > 医药、卫生 > 药学 > 药物基础科学
© 2012 www.xueweilunwen.com