学位论文 > 优秀研究生学位论文题录展示
多元校正与定量结构活性相关性研究中新型化学计量学算法研究
作 者: 周燕平
导 师: 俞汝勤;沈国励
学 校: 湖南大学
专 业: 分析化学
关键词: 多元校正 定量构效关系研究 推进 粒子群优化算法 人工神经网络 支持向量机 分类与回归树
分类号: O655
类 型: 博士论文
年 份: 2007年
下 载: 285次
引 用: 0次
阅 读: 论文下载
内容摘要
本文作者对多元校正和定量结构活性相关性研究这两个领域中的一些难点问题进行了深入的研究,提出了多种新型的化学计量学算法,并将其应用于实际体系的研究。本论文的内容主要涉及到以下几个方面:1.设计了一种基于镱为内标的近红外光谱干膜法结合推进支持向量回归来进行血糖分析。稀土元素镱被用作内标以解决干膜制备过程中各个干膜厚度不一的难题。推进支持向量回归法通过组合支持向量回归和推进算法而得到。其基本思想为通过迭代逐步地构建出一组支持向量回归模型,每一个支持向量回归模型都着重弥补前一个支持向量回归模型的缺陷,最后组合所有的支持向量回归模型的结果,以获得最终的预测结果。结果表明通过使用近红外光谱内标干膜法结合推进支持向量回归建模,水吸收的干扰能被很好的消除,血浆中的葡萄糖浓度能够被准确的测出,且样品用量少(仅50μL)。另外,推进技术明显提高了单个支持向量回归模型的性能,与传统的支持向量回归法和偏最小二乘法相比,推进支持向量回归法能提供更好的性能。因此,近红外光谱内标干膜法结合推进支持向量回归法,将有望于成为新的有效的血糖分析工具,并可用于生物流体中其它具有临床意义的分析物的近红外光谱分析。2.结合红外光谱内标干膜法与推进支持向量回归用于血糖分析。硫氰酸钾为干膜法中的内标。同时,移动窗口偏最小二乘回归被用来选择有效的波数区间以用于多变量建模。红外光谱内标干膜法结合推进支持向量回归能有效地克服水吸收给血糖测量带来的干扰,在理想的精度范围内测定血糖,且样品需求体积少(仅5μL)。同时,我们也将推进支持向量回归法与传统的偏最小二乘法和支持向量回归法进行了性能比较。结果证明,推进支持向量回归为一种有效的多元校正方法,其性能要明显优于传统的支持向量回归法和偏最小二乘法。3.应用推进支持向量回归法对一系列硝基苯化合物和1-苯基[2氢]-4氢-3嗪-3-氢衍生物作为5-脂氧合酶抑制剂进行了定量构效关系研究。结果表明,推进支持向量回归的性能要明显优于多元线性回归法和支持向量回归法,是定量构效关系研究中的一种有效的建模方法,可以作为一种补充性工具,为新药研制提供了一条捷径。4.提出了一种稳健版本的推进技术,并将其用于提高偏最小二乘法的性能,即稳健推进偏最小二乘。该算法的基本思想为:通过在迭代过程中引入一个误差修剪策略来建立一系列稳健的偏最小二乘模型,最后组合所有的偏最小二乘模型的结果,以获得最终的预测结果。其中,F-统计被用来自动确定偏最小二乘模型的维数。我们将提出的算法用于预测4氢-1,2,4-三唑类化合物对血管紧缩素II的拮抗活性,获得了满意的结果。5.分析了传统的径向基函数网络构建方法引起网络过拟合和局部最优的原因,将杂交的粒子群优化算法用于自适应构建径向基函数网络。连续的粒子群优化算法用来训练网络参数(包括中心,宽度和权重),而改进的离散粒子群优化算法用于确定适宜的网络结构(隐节点个数),两种版本的粒子群优化算法相结合来搜索全局最优的网络结构和参数。为了增加网络的灵活性和减少输入变量的过分的可变性,椭圆径向基函数被用来作为径向基函数网络中的基函数。我们还提出了一个新的拟合函数来确定最佳的网络结构和参数。我们用所提出的径向基函数网络构建方法来预测二[(吖啶-4-羧基酰胺)丙基]甲胺衍生物对老鼠P388白血病细胞的抑制活性和环氧酶抑制剂的生物活性,并与固定网络结构,用粒子群优化算法和K-均值方法结合规整化方法仅训练网络参数的结果作了比较,结果表明杂交的粒子群算法能有效的训练网络,快速地收敛于最优解,所构建的网络能在一定程度上避免了过拟合和局部最优现象的产生。6.提出了一种的基于径向基函数网络转换的全局最优的非线性支持向量机算法。该算法通过一个只有一个输入层和一个隐含层的径向基函数网络实现原始变量到特征空间的非线性变换。该变换本质上是实现了原始变量的核变换。用粒子群优化算法协同优化所有参数包括核中心、核宽度以及支持向量机中系数使得按照全模型的性能作出灵活的核变换成为可能。对艾滋病毒1型逆转录酶抑制剂与1-苯基苯并咪唑活性的定量构效关系研究结果表明,所提出的算法性能相当稳定,且要优于反向传播神经网络以及传统的非线性支持向量机。7.结合了偏最小二乘法能克服共线性问题和神经网络能拟合强的非线性关系的优点,提出了一种优化的非线性版本的偏最小二乘算法。这种算法首先用神经网络中非线性映射将化合物的描述符转化成隐含层的输出,然后用偏最小二乘回归来关联隐含层的输出和化合物的生物活性,粒子群优化算法以模型误差为目标函数被用于优化输入层和隐含层之间的权重以获得一个满意的非线性版本的偏最小二乘模型。非线性偏最小二乘法既能很好的拟合数据中的非线性关系又能有效的抑制过拟合现象的产生,为复杂数据解析提供了有效的新工具。8.为克服传统方法构建的分类与回归树中存在的过拟合和局部最优等问题,引入了改进的离散粒子群算法来自适应构建分类与回归树,即同时搜索每个分枝节点中最优的分枝变量和分枝值以及合适的树结构(即:树的复杂性)。该方法集树的生长、修剪于一体,并不需要选择子树。另外,我们还提出了一个新的目标函数来确定合适的树的复杂性和最优的分枝变量及相应的分枝值。将所提出的分类与回归树构建方法用于预测类黄酮衍生物的生物活性和表皮生长因子受体酪氨酸酶抑制剂的抑制活性,结果表明,改进的离散粒子群算法为一种有效的分类与回归树构建方法,快速地收敛到最优解,所构建的分类与回归树能在很大程度上避免了过拟合问题的产生,由改进的离散粒子群算法构建的分类与回归树要优于传统方法所构建的树。
|
全文目录
摘要 5-8 Abstract 8-14 第1章 绪论 14-26 1.1 多元校正 15-16 1.2 定量构效关系研究 16-18 1.3 推进(boosting) 18-19 1.4 粒子群算法 19-20 1.5 人工神经网络 20-21 1.6 支持向量机 21-22 1.7 分类与回归树(classification and regression trees,CART) 22-23 1.8 本论文的研究工作 23-26 第2章 基于镱为内标的近红外光谱干膜法结合推进支持向量回归的血糖测定研究 26-37 2.1 前言 26-27 2.2 理论 27-30 2.3 实验 30-31 2.4 结果与讨论 31-36 2.5 小结 36-37 第3章 傅立叶变换-红外光谱干膜法结合推进支持向量回归用于测定血浆中葡萄糖 37-44 3.1 前言 37-38 3.2 理论 38 3.3 实验 38-39 3.4 结果与讨论 39-43 3.5 小结 43-44 第4章 推进支持向量回归法用于定量构效关系研究 44-56 4.1 前言 44-45 4.2 理论 45 4.3 数据集 45-49 4.4 结果与讨论 49-55 4.5 小结 55-56 第5章 稳健推进偏最小二乘回归用于血管紧缩素II 抑制剂的定量构效关系研究 56-66 5.1 前言 56-58 5.2 理论 58-60 5.3 数据集 60-62 5.4 结果与讨论 62-65 5.5 小结 65-66 第6章 杂交粒子群算法用于自适应构建径向基函数网络 66-81 6.1 前言 66-67 6.2 理论 67-71 6.3 数据集 71-75 6.4 结果与讨论 75-80 6.5 小结 80-81 第7 章粒子群优化算法用于训练基于径向基函数网络变换的非线性支持向量机及其 QSAR 研究应用 81-93 7.1 前言 81-82 7.2 理论 82-83 7.3 数据集 83-88 7.4 结果与讨论 88-92 7.5 小结 92-93 第8章 基于神经网络转换的非线性偏最小二乘回归用于定量构效关系研究 93-104 8.1 前言 93-94 8.2 理论 94-95 8.3 数据集 95-98 8.4 结果与讨论 98-102 8.5 小结 102-104 第9章 改进的离散粒子群算法用于自适应构建全局最优的分类与回归树 104-123 9.1 前言 104-105 9.2 理论 105-110 9.3 数据集 110-114 9.4 结果与讨论 114-122 9.5 小结 122-123 结论 123-125 参考文献 125-151 致谢 151-152 附录A 攻读学位期间发表及完成的论文目录 152-153
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- Hall推进器寿命预测和壁面侵蚀加速实验研究,V439.2
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 主述位理论在初中英语阅读教学的应用研究,G633.41
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
- 马克思主义中国化时代化大众化研究,D61
- 基于车载3D加速传感器的路况监测研究,TP274
- 兖州矿区植物波谱变异与重金属胁迫特征研究,X173
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
中图分类: > 数理科学和化学 > 化学 > 分析化学 > 无机分析 > 定量分析(定量分析学)
© 2012 www.xueweilunwen.com
|