首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
紫杉醇类似物定量构效关系(QSAR)的研究   总被引:1,自引:0,他引:1  
紫杉醇是从紫杉或称红豆杉中提取的1种天然抗癌物质,具有独特的抗癌机理。由于紫杉醇的种种限制,开发具有更高抗癌活性的紫杉醇类似物药物具有广阔的前景。本文选用36个结构多样的紫杉醇类似物分子作为数据集,随机选取其中28个作为训练集,其它为检验集,采用多元线性回归(MLR)法及主成分回归分析(PCA)法分析每个化合物的197个分子参数,分别建立定量构效关系的最优预测模型。并用检验集检验所建模型的预测能力。结果表明:多元线性回归分析法所建模型与主成分回归所建模型相比,发现逐步筛选法为最优建模方法。该方法所建模型统计结果良好(R~2=0.846,SEE=1.060),应用于检验集时,结果也比较满意(R~2=0.841,SEP=1.071),模型的可靠性和预测性较强。建模和确定主要影响因素有助于指导筛选和研发新型类紫杉醇药物。  相似文献   

2.
目的在于定量预测雄激素受体干扰物活性,并确定最佳建模方法。选择150个分子作为数据集,随机选38个分子作为检验集,其它分子为训练集。每个化合物分子计算了193个分子参数。通过采用多元线性回归和主成分回归等方法,建立数学模型,并用验证集检验了所建模型的预测能力。结果发现逐步筛选法和主成分分析方法所建模型都表现出较强的预测能力(应用于检验集的相关系数分别为R=0.61,R=0.52)。以上研究将有助于新药雄激素受体抑制剂的筛选和开发。  相似文献   

3.
以2D-autocorrelation描述符为结构参数,采用PSO和逐步回归的方法进行变量筛选,再结合SVM等机器学习算法对28种苯丙烯盐类化合物对EBV-EA病毒的抑制性活性进行定量构效关系(QSAR)研究.研究结果表明,PSO-v-SVM模型具有最优的模型稳健性和预测效果.由PSO选入的构成该模型的5个2D-autocorrelation描述符为ATS5v,ATS6e,ATS8e,ATS3p,GATS5p;该模型对训练集的拟合和留一法交叉验证结果的相关系数R~2和q_(cv)~2分别为0.986和0.930,对测试集预测结果的相关系数R~2_(ext)达0.955.对5个变量的理化意义的分析表明,极化率、Van der Waals体积和电负性对苯丙烯盐类化合物的抑制性活性影响分别约占57.13%、15.90%和26.97%.  相似文献   

4.
应用HyperChem7.0计算与二芳基咪唑类化合物选择性环氧化酶(COX-2)的抑制性相关的量化参数以及自己设计的结构编码参数,对52种1,2-二芳基咪唑化合物的抑制性做QSAR研究.使用逐步回归筛选出影响抑制性的主要参数分子偶极矩μ、分子疏水参数logP和编码参数R2、R5和R7建立QSAR方程.经留三法验证,检验结果相关系数R为0.9155,剩余标准偏差s为0.3601,与回归拟合得到的R=0.9357,s=0.3157接近,表明所建QSAR方程预测效果较好,稳定性较高.对筛选参数的分析表明,μ、logP主要通过影响化合物的脂溶性,R2、R5通过影响化合物的空间结构,R7则通过化合物与COX-2对应活性位点氢键作用的变化,分别对化合物对COX-2的抑制性产生影响.  相似文献   

5.
以86个离子化合物的正、负离子的有效核电荷Z~(*+)、Z~(*-)、离子半径r_+、r_-,以及正离子的荷径比Z~(*+)/Υ_+5种结构参数作为自变量,以晶格能U作为因变量,采用BP神经网络建立关于无机离子晶体晶格能的结构-性质关系(QSPR)模型.该模型由输入层、隐含层和输出层构成3层BP神经网络,86个离子化合物样本则按文献分别划分为训练集和验证集.研究表明,当隐含层神经元个数为5时模型效果最佳:该模型对训练集拟合结果的决定系数R~2=0.9965,平均相对误差MRE=1.63%;对验证集预测结果的R~2=0.9952,MRE=1.85%.  相似文献   

6.
复杂系统或过程参数优化问题往往采用建模发现其潜在规律,再通过优化方法利用该规律获取最佳工艺参数。而建模误差的存在,往往使优化解与实际最佳工艺参数存在差距,难以获得理想性能。为此提出一种基于误差补偿模型的优化决策方法,通过分析并选取影响建模误差的因素,构建误差补偿模型,修正模型,提高决策性能。首先,从数据挖掘角度建立复杂工艺近似模型,并分析影响建模误差的主要因素;其次,以训练误差为导师信号,利用BP网络建立影响因素与建模误差之间的函数关系,确定误差补偿函数;最后,将近似模型与补偿函数叠加作为最终的工艺模型。数学仿真与电路系统优化实验结果表明:误差补偿后,仿真模型得到的优化函数最优值相对误差降低9.63%,而电路系统中决策参数的超调量下降2.17%。可见,补偿模型优化参数控制效果优于近似模型,验证了所提方法对于提高工艺参数优化决策性能有效性。  相似文献   

7.
基于遗传算法的支持向量机预测含能材料密度的研究   总被引:4,自引:2,他引:2  
基于遗传算法(genetic algorithm,GA)的变量筛选和支持向量机(support vector machine,SVM),提出了一种改进的定量结构-性质相关(quantitative structure detonation relationship,QSPR)建模方法——遗传-支持向量机(GA-SVM),并用其建立含能材料的定量结构-爆轰性能关系(QSDR)模型,此外还应用标准SVM方法建立了QSDR模型,并用这2种模型进行呋咱系含能化合物密度的预测,随机选取85%化合物作为训练集,用来建立模型,其余化合物作为测试集来测试模型的预测能力。预测结果的交互检验的相关系数平方分别为0.9887和0.9885,平均相对误差分别为1.16%和2.12%,表明了2种建模方法的有效性。通过对2种模型的预测能力进行比较,GA-SVM方法建立的QSDR模型能更好地预测呋咱系含能化合物的密度,更利于实际应用。  相似文献   

8.
量子化学参数用于脂肪族化合物分配系数的QSPR研究   总被引:1,自引:1,他引:0  
采用ChemOffice 8.0中的MOPAC-AM 1量子化学方法计算149种脂肪族化合物的6种量子化学参数,取142个化合物作为样本集,用多元逐步回归分析法建立定量结构相关(QSPR)模型.模型能预测好脂肪族化合物的正辛醇/水分配系数(logP).logP平均误差为0.176个对数单位,模型的稳健性检验结果表明,模型中自变量无相关关系,残差呈正态分布.预测7个样本以验证模型,表明该模型的预测能力较好.  相似文献   

9.
有机化合物的水溶解度是重要的物理化学性质.本文用18个拓扑符去描述1293个化合物的分子结构.先建立1293个有机化合物的分类模型,按照logS的大小,将数据分成三类,通过训练集建立模型,并用测试集检验,分类准确率达92.2%.在此基础上,以上述18个描述符作为输入,losS作为输出,研究水溶解度的定量,建立支持向量机预测模型.比较测试集的结果,以前建立的人工神经网络模型相关系数r2=0.94和标准偏差sd=0.52,而本文建立的支持向量机模型r2=0.95和sd=0.50,显然优于以前建立的模型.  相似文献   

10.
用DFT-B3LYP方法,在较高基组6-311G~(**)水平下,全优化计算36种麻醉药分子的量子化学参数,结合麻醉药对费氏弧菌的毒性数据(-1gEC_(50)),由线性回归方法建立QSAR模型。对训练集样本经逐步多元回归分析后,所建QSAR方程的复相关系数R~2及去一法交互检验复相关系数q~2分别为0.959和0.943,用预测集样本预测外部,所得外部预测样本复相关系数R_(pred)~2为0.982。结果表明:麻醉药的毒性主要由V、E_(HOMO)、E_(NHOMO)和E_T决定,V和E_(NHOMO)越大,化合物对费氏弧菌的毒性越大;E_T和E_(HOMO)越小,化合物毒性越大。  相似文献   

11.
本文根据电化学基本原理,应用数据模型化和曲面拟合的方法,建立了Pb-Sn合金电镀的镀层层份和各影响因素的数学模型,并结合具体的实验对模型进行了计算,求取了目标函数和各有关参数;同时分几种情况对拟合的结果进行了考察,取得了比较满意的结果。  相似文献   

12.
磨矿分级过程具有多变量、非线性等特点,基于多元回归理论的数学模型难以满足精度要求,迅速发展的神经网络技术可以建立高精度的变量间的非线性映射模型。在已有螺旋分级机基本模型的基础上,利用RBF神经网络建立螺旋分级机的数学模型,并用遗传算法对神经网络进行优化。用某选矿厂两段磨矿分级回路的实际生产数据进行了仿真实验,仿真结果表明,模型精度满足工艺要求。  相似文献   

13.
能量代谢守恒法无创血糖检测算法研究   总被引:3,自引:0,他引:3  
根据能量代谢守恒法无创血糖检测的基本原理,设计出无创血糖检测探头并推导出血糖检测的数学模型。采用了多元线性回归和主分量分析方法处理数据,得出了计算血糖值的多元线性表达式,获得了对血糖值贡献最大的两个分量。实验结果显示,采用上述算法计算得出的血糖值与血糖真实值之间的相关系数R=0.86,表明了采用主分量分析和多元线性回归求解无创血糖检测模型的方法是可行的。  相似文献   

14.
以农业试验设计方法为依据,数学模型理论为指导,程序设计为工具,研制了“农业试验数学模型生成系统”。该系统分为回归分析模型、相关分析模型、聚类分析模型、时间序列分析模型和方差分析五个主要功能模块。  相似文献   

15.
A difference diffusion model with two equilibrium states is given by the stochastic equations with two components: a predictable one, defined by increments regression function with two equilibrium states, and a stochastic one, which is a martingale difference. A classification of zones is proposed based on the asymptotic properties of the trajectories of statistical experiments. The asymptotic behavior of statistical experiments defined by sums of N sample values as N → ∞ is investigated  相似文献   

16.
遗传算法在数据挖掘中的应用   总被引:4,自引:0,他引:4  
论文介绍一种利用遗传算法的演化计算机编程的方法来自动建立一种动态非线性数学模型进行数据挖掘,并进行社会经济趋势预测和回归曲线拟合,改变过去那种只使用拟合粗糙、预测结果准确度差的传统预测模型进行曲线拟合和趋势预测的分析方法。在数据实验中,使用遗传算法演化计算机编程的方法自动生成的演化模型对一些真实的历史资料进行了曲线拟合和发展趋势预测以及对前馈、后馈误差进行了深入分析。结果表明,使用该方法建立的演化模型要比传统的线性回归、指数回归、抛物线回归三种固定传统数学模型所预测的数据准确度高很多,而且拟合曲线的前馈标准差和预测后馈标准差也明显要小。  相似文献   

17.
运用联合分析原理建立数学模型,根据数学模型和项目情况进行系统分析设计,运用程序开发等相关技术实现在线产品分析系统,该系统提供给设计和销售人员进行产品调查和分析,从而提供产品各属性水平的效用值、重要性及产品潜在的市场占有率,以指导产品研发设计和产品进货选择.  相似文献   

18.
神经网络模型在预测土壤pH值中的应用研究   总被引:2,自引:0,他引:2  
杨珏  汪德耀 《计算机仿真》2004,21(4):121-125
该文通过对西藏察雅县105层土样资料(1988年)建立CaCO3-pH神经网络模型,与刘世全等所做的回归模型在拟合精度和预测性能方面作了比较,结果显示,BP网络在拟合性能方面不亚于回归方法,在预测性能上要优于回归方法。该文对将神经网络引入土壤环境系统的研究中作了有意义的尝试;所建立CaCO3-pH间的关系模型,是研究污染物在土壤中的降解和转化的重要基础,对评价周边环境因素对土壤的综合作用也有重要意义。本文的结论说明,神经网络对于研究土壤系统的目标因子和相应的影响因子间的关系方面,是较为适用的数学手段。  相似文献   

19.
自动化控制中曲线拟合的应用及研究   总被引:1,自引:0,他引:1  
文章从曲线拟合的基本原理出发,介绍了在无数学模型的情况下如何选取适当的函数来解决工业控制中的一些常见问题,并使用高级语言程序来对数学解析式进行求解。  相似文献   

20.
用文献设定的结构参数和本文设定的结构参数,分别与由HyperChem7.5Student Evaluation计算得到的量化参数作为自变量构成2组数据,以逐步回归,遗传算法-偏最小二乘法(GA-PLS)和遗传算法-支持向量机(GA-SVM)等算法就黄酮类化合物对PTKs抑制性进行QSAR研究。用各算法模型处理数据,由本文设定的结构参数构成的数据集获得的预测结果更好,表明采用取代基团类型和取代位置结合的编码参数包含的信息更为丰富,对物质性质的描述更加合理。在各种算法中, GA-SVM模型均具有最佳预测效果,该算法对2组数据作留一法预测处理得到的相关系数R和PTKs抑制性实验值与预测值的平均绝对误差MAE分别为0.7595,0.2871和0.7864,0.2883。研究还表明,GA-PLS和GA-SVM联用算法的预测效果远高于单独使用的PLS和SVM算法;由逐步回归建立的MLR模型对2组数据进行计算处理,尽管拟合时相关系数R分别达到0.8136和0.8250,但作留一法交互验证时却下降到0.7113和0.7354,明显低于GA-PLS和GA-SVM联用算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号