首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 296 毫秒
1.
烃类物质闪点定量构效的关系   总被引:1,自引:0,他引:1  
应用CODESSA软件计算300种烃类物质的分子结构描述符,用启发式回归(HM)、最佳多元线性回归(B-MLR)法,以筛选出来的分子描述符建立线性回归模型.用B-MLR法所选4个描述符作为支持向量机(SVM)的输入,建立非线性模型.预测结果表明:所建模型稳健,泛化能力强,预测误差小.非线性模型(R2=0.9884,RMSE=8.7570)的性能优于线性回归模型(HM:R2=0.9815,RMSE=11.0653;B-MLR:R2=0.9814,RMSE=11.1041),预测的效果令人满意.  相似文献   

2.
对125个磺胺类碳酸酐酶Ⅱ抑制剂的生物活性进行了预测研究。利用ADRIANA.Code软件计算得到了化合物的一系列2D和3D结构描述符,从中选用了12个描述符进行建模。分别用数学随机划分的方法和Kohonen自组织神经网络的方法把数据集划分成两组不同的训练集和测试集。对于这两组不同的训练集和测试集,分别利用多元线性回归(MLR)和支持向量机(SVM)的方法进行建模,共得到4个模型。其中SVM得到的2个模型,训练集的相关系数在0.92以上,测试集预测的相关系数都在0.90以上。所有模型可进一步用于碳酸酐酶Ⅱ抑制剂的虚拟筛选。  相似文献   

3.
脂肪醇化合物对梨形四膜虫急性毒性的QSAR研究   总被引:1,自引:0,他引:1  
为提高脂肪醇化合物对梨形四膜虫急性毒性的预测精度,提出基于定量结构-活性关系(QSAR)原理的脂肪醇化合物对梨形四膜虫急性毒性预测方法。运用遗传算法筛选出5种分子描述符作为变量,采用多元线性回归方法和最小二乘-支持向量机方法建立基于该5种分子描述符的脂肪醇化合物对梨形四膜虫急性毒性的预测模型。对所建立的模型进行内部验证和外部验证,两种模型的复相关系数、留一法交互验证系数分别为0.984、0.979和0.985、0.982,对外部预测样本的复相关系数和外部测试集交互验证系数分别为0.978、0.977和0.979、0.979。结果表明,所建QSAR模型均具有较好的稳健性、预测能力和泛化性能。LS-SVM模型在精度上略优于ML-R模型,而MLR模型更为简单和方便。  相似文献   

4.
通过构建分子顶点原子之间的关系对35个醛酮类化合物进行了结构表征,采用多元线性回归和逐步回归的方法建立了该类化合物结构与色谱保留指数之间的关系模型,模型的复相关系数(R)为0.978,标准偏差(SD)为37.305。采用"留一法"交互检验和外部样本预测的方法对模型的稳定性和预测能力进行了评价,交互检验的复相关系数(R_(cv))为0.970,标准偏差(SD_(cv))为43.477;外部预测的复相关系数(R_(test))为0.996,标准偏差(SD_(test)为17.004。结果表明所采用的分子结构描述符能够恰当表现该类化合物结构特征,所建模型具有良好的稳定性和预测能力。  相似文献   

5.
采用支持向量机回归(SVR)方法研究了39个麻醉药毒性的定量构效关系,基于留一法交叉验证的结果,模型的相关系数为0.970。结果表明,所建SVR模型的精度高于逆传播人工神经网络(BPANN)、多元线性回归(MLR)和偏最小二乘法(PLS)所得的结果。  相似文献   

6.
用支持向量机回归(SVR)方法研究了48个黄酮类化合物醛糖还原酶抑制活性的定量构效关系。建模过程中利用留一法交叉验证(LOOCV)优化了核函数的类型、惩罚系数C和不敏感函数ε.所建模型最终采用了227个变量中的7个:dChivps9, ESHaaCH,EsssCH2,n2pag[1,2],degree2,I'3和I'4。所得SVR模型的预测相对误差为0.0622,小于多元线性回归(MLR)和偏最小二乘法(PLS),以及文献报道模型的预测相对误差。  相似文献   

7.
采用支持向量回归方法研究了1,4,2-二氮磷杂环戊-5-(硫)酮类化合物除草活性的QSAR。基于留一法交叉验证的结果,比较了支持向量机回归(SVR)与几种常用建模方法对于该类化合物除草活性的预测精度。研究表明:所建SVR模型的精度高于逆传播人工神经网络(BPANN)、多元线性回归和偏最小二乘(PLS)所得结果。  相似文献   

8.
张振  钮冰 《计算机与应用化学》2011,28(11):1377-1380
采用支持向量机回归(SVR)方法研究了40个抗癌化合物-二取代[(吖啶-4-酰胺基)丙基]甲胺类衍生物的定量构效关系,基于留一法交叉验证的结果,其平均相对误差是6.56%.结果表明,所建SVR模型的精度高于逆传播人工神经网络(BPANN)、多元线性回归(MLR)和偏最小二乘法(PLS)所得的结果.  相似文献   

9.
基于定量构效关系(QSPR)原理,对有机过氧化物的自加速分解温度(SADT)与其分子结构间的内在联系进行了研究。应用CODESSA软件计算46种有机过氧化物的分子描述符。采用最佳多元线性回归(B-MLR)法对描述符进行筛选获得7个特征描述符,并同时建立线性回归模型。将7个特征描述符作为输入参数,采用支持向量机(SVM)法建立非线性模型。随后对模型进行验证,结果表明,B-MLR模型和SVM模型均具有良好的拟合能力、稳定性和预测能力,且SVM模型的性能(R_(train)~2=0.958,R_(test)~2=0.862)优于B-MLR模型(R_(train)~2=0.930,R_(test)~2=0.844)。通过对特征描述符的分析发现了影响SADT的主要结构因素。采用Williams图分析了模型的应用域,结果表明所有样本均在模型的应用域范围内。本文所建立的B-MLR模型和SVM模型可应用于有机过氧化物SADT的预测。  相似文献   

10.
基于量化参数的脂肪醇沸点QSPR研究   总被引:5,自引:4,他引:1  
应用HyperChem7.0计算与脂肪醇沸点相关的结构参数对119种脂肪醇的沸点做定量结构性质关系(QSPR)研究。在逐步回归算法筛选出影响脂肪醇沸点的分子偶极矩μ、分子最高占有轨道能EHOMO、分子最低空轨道能ELUMO、分子范德华表面积Sg、摩尔折射率Rm、极化率α、分子质量M和疏水参数logP 8个主要结构参数的基础上,采用ε-支持向量机、多元线性回归,以及径向基函数神经网络算法,通过留一法交叉验证建立脂肪醇沸点的QSPR预测模型,3种模型中ε-支持向量机、多元线性回归和径向基函数神经网络模型留一法预测结果的相关系数R分别为0.993、0.988、0.987,标准偏差s则分别为4.774、6.501、6.724,表明ε-支持向量机模型具有最好的预测效果。  相似文献   

11.
12.
13.
14.
从头计算研究水溶液中有机化合物的pKa值   总被引:1,自引:0,他引:1  
运用量子化学方法计算水溶液中一些含氮小分子化合物和醇、酚、羧酸的pKa值。采取从头计算的Hartree-Fock法和6- 31G(d,p)基组,以及aug-cc-pVDZ基组,密度泛函理论的B3LYP法6-31G(d,p)基组,分别优化分子和离子的气相几何结构,采用极化连续介质模型模拟溶质和溶剂分子间的相互作用,不同方法和基组计算结果差别不大,18个化合物的均方根误差均为1.03,预测值与实验值的相关系数均为0.98,一致性较好。证明HF/6-31G(d,p)法和模型计算或预测含有相同官能团的小分子的pKa数值很合理,能够为研究药物分子体系的构效关系提供精确的pKa参数。  相似文献   

15.
16.
17.
18.
据不完全统计显示,2020年全球乳腺癌新增人数达到226万,女性乳腺癌是最常见的癌症类型,死亡率高居第五,因此对乳腺癌的治疗研究变得愈发重要。对雌激素受体α亚型(ERα)的研究显示其在乳腺发育过程中扮演重要角色。本文收集作用于ERα的化合物及其生物活性数据,并以一系列分子结构描述符作为自变量和以化合物的生物活性值作为因变量,通过随机森林与梯度提升树并融合专家知识来构建分子筛选模型,筛选出前20个对生物活性最具有显著影响的分子描述符。这些分子描述符对指导已有活性化合物的结构优化和药物研究具有重要意义。  相似文献   

19.
环境化合物对鱼类毒性的定量构效关系研究   总被引:2,自引:2,他引:0  
本研究基于定量构效关系方法预测环境化合物对鱼类的毒害(50%Lethal Concentration,LC50),并确定影响毒性关键分子的结构特征及几种模拟方法的比较.构建114个化学分子的数据集,随机选取85个75%分子为训练集,剩下的29个分子作为检验集,每个化学分子计算194个分子参数,分别采用逐步多元线性回归分析法(multiple linear regression,MLR)、主成分回归法(Principal Component Regression,PCA)和偏最小二乘法(Partial Least Square,PLS)构建定量结构-毒害关系(Quantitativestructure-activity relationships,QSTB)模型.用逐步多元线性回归分析法得出的训练集和预测集的实验值-logLC50与预测值-logLC50的相关系数分别为R2tr=0.86,R2te=O.83,说明该模型可靠性和鲁棒性较高;主成分回归法用8个主成分,其训练集和预测集的实验-logLC50与预测-logLC50的R2tr=0.81,R2te=O.77;偏最小二乘法用了5个潜变量,其训练集和预测集的实验-logLC50与预测-logLC50的R2tr=0.88,R2te=0.85.MLR方法得出化合物对鱼类的毒害影响较大的分子参数,主要分属电拓扑状态参数(SssO,SsCl,SdCH2,SsNH2)、分子连接指数(Xvo)以及修正Kappa指数(Ka2).以上研究对预测环境化合物的鱼类毒害(LC50),以及从机理上加深对有机物的毒性作用机理提供重要价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号