首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
采用以MLR为基学习器的Boosting算法模型,对79种硫代氨基甲酸酯类衍生物做抗HIV-1逆转录酶抑制活性的QSAR研究。以E-Dragon软件计算的7组描述符分别为自变量,以化合物的半数效应浓度EC_(50)值为因变量构成7个原始数据集,用PSO算法筛选变量并建立MLR模型。各描述符建立的MLR模型中仅有RDF描述符模型同时通过外部预测和内部验证,故确定以其建立关于硫代氨基甲酸酯类衍生物抗HIV-1逆转录酶抑制活性的Boosting-MLR预测模型。Boosting-MLR模型与MLR模型相比,训练结果的决定系数R~2分别为0.728和0.741,预测结果R~2则分别为0.718和0.667,表明其泛化能力明显增强。对Boosting-MLR模型进一步进行稳定性验证,证明其预测稳定性较高。  相似文献   

2.
本文针对44个黄酮化合物对醛糖脱氢酶,采用贝叶斯正则化反向传播神经网络构建定量构效关系模型。选取116种与结构相关的分子描述符,通过遗传算法进行变量筛选。建立基于8个变量的活性预测贝叶斯正则化神经网络模型并采用验证集考察其预测性能。在该模型下,黄酮化合物对醛糖脱氢酶抑制活性的实验值和预测值一元相关系数平方(R2)分别为0.94811和0.97789。模型显示黄酮化合物醛糖脱氢酶抑制活性与其结构有密切关系。贝叶斯规整化神经网络结合遗传算法具有良好的预测能力。  相似文献   

3.
提出1种混合使用模拟退火和竞赛规则选择算子的改进GEP算法-GEPMS算法。以E-Dragon软件计算、经RM算法筛选得到的7个RDF描述符作为自变量,以抗HIV-1活性IC_(50)值作为因变量,基于GEPMS算法建立关于48种喹诺酮羧酸类化合物的HIV-1整合酶抑制剂活性的QSAR模型。与GEP、GEPSA和v-SVM算法建立的QSAR模型进行比较,本文模型、GEP、GEPSA和v-SVM模型对训练集的计算结果,决定系数R~2分别为0.9667、0.9624、0.9348和0.9711,对验证集的预测结果R~2则分别为0.9565、0.8974、0.9124和0.7656,表明本文的GEPMS模型具有最佳的泛化能力,算法的改进效果明显。  相似文献   

4.
脂肪醇化合物对梨形四膜虫急性毒性的QSAR研究   总被引:1,自引:0,他引:1  
为提高脂肪醇化合物对梨形四膜虫急性毒性的预测精度,提出基于定量结构-活性关系(QSAR)原理的脂肪醇化合物对梨形四膜虫急性毒性预测方法。运用遗传算法筛选出5种分子描述符作为变量,采用多元线性回归方法和最小二乘-支持向量机方法建立基于该5种分子描述符的脂肪醇化合物对梨形四膜虫急性毒性的预测模型。对所建立的模型进行内部验证和外部验证,两种模型的复相关系数、留一法交互验证系数分别为0.984、0.979和0.985、0.982,对外部预测样本的复相关系数和外部测试集交互验证系数分别为0.978、0.977和0.979、0.979。结果表明,所建QSAR模型均具有较好的稳健性、预测能力和泛化性能。LS-SVM模型在精度上略优于ML-R模型,而MLR模型更为简单和方便。  相似文献   

5.
建立预测类黄酮化合物抑制恶性疟原虫株活性定量的模型,并确定影响类黄酮化合物活性的主要因素。本文选用了38个结构不同的类黄酮化合物作为数据集,采用多元线性同归法及主成分分析法分析每个化合物的220个分子参数,建立最优的预测模型。比较用不同方法建立的模型,结果发现带logP参数的向后筛选法为最优方法,所建模型统计结果良好(训练集相关系数R~2=0.81,标准训练误差SEE=0.27),模型代入检验集数据时结果也令人满意(检验集相关系数R~2=0.83,标准检验误差SEP=0.39),可靠性和预测性较强。脂水分配系数的对数logP为模型重要影响参数。建模和确定影响因素有助于筛选新型类黄酮抗疟疾药物和研发。  相似文献   

6.
p38α丝裂原活化蛋白激酶(p38α mitogen-activated protein kinase,p38α MAPK)是治疗类风湿关节炎的最有效的靶点之一,联苯酰胺是最近新发现的一类强效、高选择性的p38α MAPK抑制剂,本文运用比较分子力场分析(CoMFA)研究21个联苯酰胺类p38αMAPK抑制剂三维定量构效关系.建立CoMFA模型的交叉验证系数q2=0.542,非交叉验证相关系数r2=0.935,统计方差比F=43.136.预测训练集和测试集化合物活性,其值和实验值非常接近,表明模型的预测能力很好.模型显示立体场和静电场对生物活性的贡献分别为78.8%和21.2%.CoMFA模型的三维等值图可为化合物的结构改造提供理论依据.  相似文献   

7.
基于统计相关性的变量选择用于麻痹性贝毒素的QSAR研究   总被引:1,自引:1,他引:0  
使用27种麻痹性贝毒素中的1751种分子结构描述符和其半数致死浓度建QSAR模型,采用基于统计相关性的变量选择(Correlation-based Feature Selection,CFS)法选择变量,并使用交叉验证法检验变量子集,最后从1751种分子结构描述符中,筛选出43种与目标值关系极密但内部关系较低的变量.用主成分分析法压缩变量集的维度,提取10种主成分作为新的变量建QSAR模型.模型的相关系数R2为0.891,交叉验证系数q2为0.809,表明模型拟合效果和预测能力良好.用"Jackknife法"检验模型的稳定性,有88.9%的相关系数R落在0.94和0.95之间,说明模型稳健性和可靠性较强.结果,基于统计相关性的变量选择法非常适合从成百上千种变量中筛选,它在消除无关变量的同时也能消除重复变量,有利于数据的处理,在QSAR建模中应用前景广阔.  相似文献   

8.
对125个磺胺类碳酸酐酶Ⅱ抑制剂的生物活性进行了预测研究。利用ADRIANA.Code软件计算得到了化合物的一系列2D和3D结构描述符,从中选用了12个描述符进行建模。分别用数学随机划分的方法和Kohonen自组织神经网络的方法把数据集划分成两组不同的训练集和测试集。对于这两组不同的训练集和测试集,分别利用多元线性回归(MLR)和支持向量机(SVM)的方法进行建模,共得到4个模型。其中SVM得到的2个模型,训练集的相关系数在0.92以上,测试集预测的相关系数都在0.90以上。所有模型可进一步用于碳酸酐酶Ⅱ抑制剂的虚拟筛选。  相似文献   

9.
以86个离子化合物的正、负离子的有效核电荷Z~(*+)、Z~(*-)、离子半径r_+、r_-,以及正离子的荷径比Z~(*+)/Υ_+5种结构参数作为自变量,以晶格能U作为因变量,采用BP神经网络建立关于无机离子晶体晶格能的结构-性质关系(QSPR)模型.该模型由输入层、隐含层和输出层构成3层BP神经网络,86个离子化合物样本则按文献分别划分为训练集和验证集.研究表明,当隐含层神经元个数为5时模型效果最佳:该模型对训练集拟合结果的决定系数R~2=0.9965,平均相对误差MRE=1.63%;对验证集预测结果的R~2=0.9952,MRE=1.85%.  相似文献   

10.
以35种嘌呤骨架类热休克蛋白90(Hsp90)化合物为研究对象,以文献[3]的8个变量构成自变量集,提出1种改进的MC_GEP算法对该类化合物抗癌活性pEC50做定量结构活性关系研究.按文献[3]对所有35种嘌呤类化合物建模,本文GEP模型与文献[3]的回归模型计算结果决定系数R2分别为0.821 4和0.738 0.进一步用七均值聚类算法将此35种化合物划分为训练集和预测集,分别采用改进的MC_GEP算法、v-SVM和ε-SVM算法基于训练集建模,本文建立的GEP模型训练和预测结果R2分别为0.808 0和0.745 5,而v-SVM和ε-SVM模型对预测集的预测结果R2分别为0.204 6和0.410 3,均低于0.5.研究表明,本文提出的改进MC GEP算法函数发现能力较强,建立的QSAR模型预测性能好.  相似文献   

11.
12.
13.
14.
15.
16.
17.
18.
19.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号