首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
MEDV用于取代苯酚定量构效关系研究   总被引:1,自引:1,他引:0  
基于定量结构-活性关系(QSAR)研究取代苯酚化合物的性质具有重要意义.分子电性距离矢量(MEDV)是1种描述分子二维结构的拓扑描述子,由4种类型原子间的相互作用得到的10个矢量组成.采用MEDV表征取代苯酚化合物的分子结构,运用多元线性回归技术,同时采用逐步回归结合统计检测对模型变量进行筛选,建立了取代苯酚诱发浮萍萎黄活性、取代苯酚臭氧氧化表观速率常数与MEDV的QSAR模型,继用留一法和外部样本检验模型稳定性能.其复相关系数(R)、留一法(LOO)交互校验复相关系数(Rcv)和外部样本校验复相关系数(Qext)分别为0.9850、0.9621、0.8218;0.8579、0.7621、0.7966.结果表明,MEDV计算简单,对于取代苯酚的结构表征能力较强,所建OSAR模型具有良好的稳定性和预测能力.  相似文献   

2.
定量构效关系为药物设计和筛选提供相对简便途径并受到广泛重视。为更好模拟药物结构与活性间相关性,尝试采用本实验室新近提出三维原子场全息作用矢量,基于三种经典原子间静电、立体和疏水即非键作用方式,不借助任何实验参数对35个HETP类抗艾滋病药物进行定量活性构效关系。模型估计和交互校验复相关系数和标准偏筹分别为R_(cu)~2=0.882、Q_(?)~2 =0.812与RMSEE=0.43。模型具良好稳定性和预测力,表明此矢量在分子结构表征和生物活性预测的适应性。  相似文献   

3.
鬼臼脂素衍生物的结构表征和抗肿瘤活性预测   总被引:3,自引:3,他引:0  
应用分子电性距离矢量(MEDV)对鬼臼脂素衍生物进行结构表征和抗肿瘤活性的活性预测,通过逐步回归(SMR)方法建立了MEDV与活性之间的定量模型,取得了良好的结果,其模型相关系数为R=0.949;继以留一法(Leave-one—out,LOO)进行交互检验,复相关系数为R^2=0.619,说明定量相关模型具有良好的稳定性和预测能力。  相似文献   

4.
使用从分子一级拓扑结构出发、结合分子中非氢原子电性和键连属性以及原子间相对距离的分子电性距离矢量(MEDV-B),对58个血管紧张素转化酶(ACE)抑制剂二肽和48个苦味(BT)二肽进行定量结构活性相关(QSAR)研究,用多元线性回归建立矢量描述子与活性观测值间相关模型,并用留一法交互校验(LOO-CV)检验其预测力,取得较满意的结果(ACE:n=58,m=10,R=0.894,RCF=0.818;BT:n=48,m=10,R=0.947,R=0.898);再用逐步回归对变量进行筛选与优化,建立新模型,稳定性与预测力得到进一步改善(ACE:n=58,m=5,R=0.859,RCV=0.824;BT:n=48,m=5,R=0.931,RCV=0.908)。结果表明:该矢量描述子可用于二肽结构表征与生物功能预测,且计算简便。  相似文献   

5.
以分子电性距离矢量(MEDV-13)表征新型均三氮苯类衍生物的分子结构,通过最佳变量子集回归建立了34种化合物除草活性的QSAR模型,模型的相关系数为0.888。模型通过R_(CV)~2、FIT、VIF等指标检验具有良好的稳健性和预测能力。根据进入模型的3个电性距离矢量m_(15)、m_(56)、m_(91)来看,影响除草剂除草活性的主要因素是分子的-CH_2-、CH-、-N-和-X等结构片段。以m_(15)、m_(56)、m_(91)为人工神经网络的输入层,设定3:6:1的网络结构,所建BP模型的相关系数为0.976,相关性明显高于多元线性回归模型。结果表明,用电性距离矢量表征均三氮苯类衍生物的除草活性是合理而有效的。  相似文献   

6.
采用分子全息距离矢量方法描述40个氨基喹啉类化合物的分子结构,运用主成分回归方法建模进行定量构效关系分析,预测其抗疟原虫活性。其两组活性数据所得结果相关系数分别为0.9438和0.9737,交互检验相关系数分别为0.8305和0.9098。由此表明所建立的多参数模型稳定,能较好地预测氨基喹啉类药物的抗疟原虫活性。为指导和设计新的高效低毒抗疟疾药物提供有力依据。  相似文献   

7.
本实验室新近提出按氢分类分子电性距离矢量(H-MEDV),用于对110个烷基苯气相色谱保留指数和54个二取代苯液相色谱容量因子进行结构表征,运用多元线性回归(multiple linear regression,MLR)以建立定量结构色谱保留关系(QSRR)模型,同时利用逐步回归结合统计检测对模型变量作筛选,建模计算值复相关系数(R_(cum))、留一法(leave-one-out,LOO)交互校验(cross-validation,CV)复相关系数(Q_(LOO)),对上述样本分别为0.9950、0.9937和0.9648、0.9530。研究结果表明,H-MEDV能较好表征该类分子结构信息,值得进一步推广。  相似文献   

8.
采用分子电性距离矢量(MEDV)描述子表征多氯代二苯并二噁[口英](PCDDs),结合基于预测的变量选择和建模方法(VSMP),从MEDV中挑选出1-2个描述子,对不同固定相下PCDDs的气相色谱保留值建立定量线性模型。结果表明MEDV分子描述子对分子结构具有很好的分辨能力,利用VSMP方法挑选的MEDV描述子很好表达了描述子与气相色谱保留值之间的相关关系,所建立的模型相关系数(R)均大于0.98,留一法交互检验的相关系数(q)均大于0.97;并均匀挑选2/3有实验数据的异构体作为训练集,余下的1/3作为检验集,进行了变量挑选、建模,结果表明,挑选的变量与用全部已知样本建模时一致,最后对没有实验值的异构体进行了预测。  相似文献   

9.
蛋白质间的相互作用在信号转导和其他许多生物进程有着至关重要的作用.从20种天然氨基酸的554个物化性质中,单变量建模方法挑选出疏水、静电、立体、氢键4个描述子表征能与人类双载蛋白SH3结构域结合的多肽,预测SH3结构域-肽亲和力.所得描述子并未对变量进行主成分分析(PCA)压缩,且只对氨基酸侧链性质进行结构表征,因此应用这4个描述子并结合多元线性回归(MLR)建模方法对SH3结构域-肽体系进行定量构效关系(OSAR)研究分析域-肽亲和力.测试集的多肽用于模型的验证,内部验证复相关系数(R2)和外部留一法交互验证相关系数(Q2)分别为:0.682,0.650,预测均方根误差(RMSE)为0.528,从模型统计数据可知,QSAR模型预测模型稳定性高,预测能力强.说明这4个描述子物具有更为确切的物化意义,表征过程更加简洁有效且研究效率高的多重优点,并可以拓展预测不同的域-肽体系.  相似文献   

10.
采用分子电性距离矢量(MEDV)描述子表征多氯代二苯并二(口惡)(口英)(PCDDs),结合基于预测的变量选择和建模方法(VSMP),从MEDV中挑选出1-2个描述子,对不同固定相下PCDDs的气相色谱保留值建立定量线性模型。结果表明MEDV分子描述子对分子结构具有很好的分辨能力。利用VSMP方法挑选的MEDV描述子很好表达了描述子与气相色谱保留值之间的相关关系,所建立的模型相关系数(R)均大于0.98,留一法交互检验的相关系数(q)均大于0.97;并均匀挑选2/3有实验数据的异构体作为训练集,余下的1/3作为检验集,进行了变量挑选、建模,结果表明,挑选的变量与用全部已知样本建模时一致,最后对没有实验值的异构体进行了预测。  相似文献   

11.
采用分子电性距离矢量(MEDV)表征酯类化合物的分子结构,同时运用多元线性回归技术建立了81个酯类化合物,在2种固定相(Carbowax1540和Cqualane)上,气相色谱保留指数(RI)与MEDV的定量结构-色谱保留关系(QSRR)模型。在2种固定相上的QSRR模型的建模计算值复相关系数(Rcum)、留一法(leave-one-out)交互校验复相关系数(QCV)分别为0.9968和0.9958(Carbowax1540);0.9935和0.9908(Cqualane),结果表明MEDV能理想地表征酯类化合物的分子结构,所建模型具有良好稳定性和预测能力。  相似文献   

12.
The typical model, which involves the measures: support, confidence, and interest, is often adapted to mining association rules. In the model, the related parameters are usually chosen by experience; consequently, the number of useful rules is hard to estimate. If the number is too large, we cannot effectively extract the meaningful rules. This paper analyzes the meanings of the parameters and designs a variety of equations between the number of rules and the parameters by using regression method. Finally, we experimentally obtain a preferable regression equation. This paper uses multiple correlation coeficients to test the fitting efiects of the equations and uses significance test to verify whether the coeficients of parameters are significantly zero or not. The regression equation that has a larger multiple correlation coeficient will be chosen as the optimally fitted equation. With the selected optimal equation, we can predict the number of rules under the given parameters and further optimize the choice of the three parameters and determine their ranges of values.  相似文献   

13.
根据189个包含不同结构基团的有机化合物在极性相差较大的2种气相色谱柱上的保留指数,以多元回归分析,分别建立了有机化合物保留指数与环境温度下蒸气压(P)的单柱和双柱预测模型。根据各模型的相关系数(r)及概率值(p),定量说明了不同模型的统计重要性。结果表明,有机化合物环境温度下的蒸气压与气相色谱保留指数之间具有较高的相关性,双柱蒸气压预测模型具有更好的预测精度(1nP标准偏差为1.3)和更好的统计学意义(r=0.9354,p=7.7×10~70))。。  相似文献   

14.
基于定量结构-性质相关(QSPR)研究多氯联苯化合物(PCBs)的性质具有重要意义。用分子负电性距离矢量(MEDV)表征209个PCBs的分子结构,同时用多元线性回归(MLR)技术和逐步回归结合留一法交叉检验筛选模型变量,建立多氯联苯类化合物的水溶性(LgS_w)、土壤吸附性(LgK_(oc))、色谱保留指数(RRI)、水溶液活度系数(LgY_w)、总分子表面积(TSA)与MEDV的QSPR模型,其线性相关系数(R)分别为0.9651,0.9692,0.9968,0.9111,0.9960。继用留一法和外部样本检验模型稳定性能,其相关系数(R_(CV),Q_(ext))分别为0.9611、0.9812;0.9572、0.9845;0.9941、0.9984;0.9980、0.9412;0.9953、0.9998。结果表明:所建QSPR模型均稳定性和预测能力良好。  相似文献   

15.
基于电子鼻技术的信阳毛尖茶咖啡碱检测方法   总被引:3,自引:0,他引:3  
本文采用电子鼻系统对三个等级的信阳毛尖茶进行了检测.采用Loading分析和相关分析对传感器阵列进行优化,选出四个传感器为最终的新传感器阵列,用于信阳毛尖茶的品质识别.PCA分析结果显示,可以将不同等级的茶叶完全区分开,而且效果比较好.利用PCR、MLR和QPSa方法分别建立信阳毛尖茶基于气敏传感器阵列的咖啡碱预测模型...  相似文献   

16.
能量代谢守恒法无创血糖检测算法研究   总被引:3,自引:0,他引:3  
根据能量代谢守恒法无创血糖检测的基本原理,设计出无创血糖检测探头并推导出血糖检测的数学模型。采用了多元线性回归和主分量分析方法处理数据,得出了计算血糖值的多元线性表达式,获得了对血糖值贡献最大的两个分量。实验结果显示,采用上述算法计算得出的血糖值与血糖真实值之间的相关系数R=0.86,表明了采用主分量分析和多元线性回归求解无创血糖检测模型的方法是可行的。  相似文献   

17.
针对人群人数统计中分割特征与纹理特征相分离以及回归模型精度提高的问题,提出一种基于PCA和多元统计回归相结合的人群人数统计方法。通过PCA对提取到的人群前景分割特征和纹理特征进行降维处理;建立多元线性回归模型,以确定特征量和人群人数之间关系的趋势方向;通过回归出的趋势方向,对高斯过程回归模型进行修正。实验结果表明该方法更适合进行大规模人群人数统计。  相似文献   

18.
19.
In information retrieval, data fusion (also known as meta-search) has been investigated by many researchers. Previous investigation and experimentation demonstrate that the linear combination method is an effective data fusion method for combining multiple information retrieval results. One advantage is its flexibility, since different weights can be assigned to different component systems so as to obtain better fusion results. The key issue is how to assign good weights to all the component retrieval systems involved. Surprisingly, research in this field is limited and it is still an open question. In this paper, we use the multiple linear regression technique with estimated relevance scores and judged scores to obtain suitable weights. Although the multiple linear regression technique is not new, the way of using it in this paper has never been attempted before for the data fusion problem in information retrieval. Our experiments with five groups of runs submitted to TREC show that the linear combination method with such a weighting strategy steadily outperforms the best component system and other data fusion methods including CombSum, CombMNZ, PosFuse, MAPFuse, SegFuse, and the linear combination method with performance level/performance square weighting schemes by large margins.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号