首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
为提高定量构效关系(quantitative structure-activity relationship,QSAR)模型预测的精度,以支持向量回归(support vector regression,SVR)全局与局部核函数,发展出1种非线性组合方法GK-LK-SVR,其基本思路为:依均方误差(MSE)最小原则,分别基于SVR的全局与局部核函数筛选描述符后预测,实测值与不同核函数的预测值组合成混合样本,然后再依MSE最小原则基于SVR对混合样本实施核函数寻优及子模型筛选,最后以留一法完成预测。对2种化合物QSAR建模结果表明:GK-LK-SVR方法预测精度高,有望在QSAR研究中得到广泛应用。  相似文献   

2.
陈虹  王飞  肖振久 《计算机科学》2013,40(11):108-111
针对网络安全态势感知中的态势预测问题,提出一种基于IHS_RELM的网络安全态势预测方法。对和声搜索算法的原理进行了研究,在此基础上提出一种改进的和声搜索算法。将正则极速学习机(RELM)嵌入到改进的和声搜索算法(IHS)的目标函数计算过程中,利用IHS算法的全局搜索能力来优化选取RELM的输入权值和隐含层阈值,在一定程度上提升了RLLM的学习能力和泛化能力。仿真实验表明,与已有的其他预测方法相比,该方法具有更好的预测效果。  相似文献   

3.
1 引言人的智慧中一个很重要的方面是从实例学习的能力,通过对已知事实的分析总结出规律,预测不能直接观测的事实。在人们对机器智能的研究中,用机器(计算机)来模拟这种学习能力,这就是我们所说的基于数据的机器学习问题,它是现代智能技术中的重要方面,其研究从观测数据(样本)出发寻找规律,利用这些规律对未来数据或无法观测的数据进行预测(分类)。统计机器学习理论为机器学习问题建立了一个较好的理论框架,也发展了一种新的通用学习算法一支持向量机(SVM),其关键思想是将在低维空间非线性可分的数据通过非线性函数(核函数)映射到一个非常高维的特征空间,并在这个新的线性空间构筑分类超平面。这一结果相应于原始空间就是通过分类超曲面进行分类判别。  相似文献   

4.
基于两层分类器的半胱氨酸氧化还原状态预测方法   总被引:1,自引:1,他引:0  
提出了两层混合分类器来预测蛋白质半胱氨酸氧化还原状态,第一层总体线性分类器利用氨基酸百分含量作为输入信息,第二层局部SVM分类器利用半胱氨酸周围局部序列作为输入信息。以2002年4月份的PISCES culled PDB数据库中的 639条蛋白质多肽链作为研究对象,共含有584条二硫键,2 904个半胱氨酸。经严格的折叠刀方法检验,预测半胱氨酸的氧化还原状态准确率最高可达84.1%(半胱氨酸水平)和80.1%(蛋白质水平)。结果表明这种将蛋白质总体信息与局部上下文序列信息结合起来构建的两层混和分类器具有较高的预测准确率。研究结果也表明总体氨基酸百分含量和半胱氨酸周围局部序列都携带有二硫键形成的相关信息,暗示了半胱氨酸是否形成二硫键不但取决于蛋白质全局的结构信息同时也受到局部序列信息的影响。  相似文献   

5.
基于小波变换(WT)的多尺度分析能力和径向基函数(RBF)神经网络良好的非线性预测与集成能力,研究了一种非线性集成预测方法.针对贮存期石英挠性加速度计零偏漂移抑制的问题,提出了基于WT和RBF神经网络的一种石英挠性加速度计零偏非线性集成预测方法.为验证所提方法的有效性,设计了一种加速度计参数的重力场标定实验,并针对某型号石英挠性加速度计进行了为期2年的标定实验.分别利用所提WT-RBF集成模型和RBF模型对零偏标定序列进行了预测分析,仿真结果显示:WT-RBF集成模型具有更好的预测性能.  相似文献   

6.
用支持向量机回归(SVR)方法研究了48个黄酮类化合物醛糖还原酶抑制活性的定量构效关系。建模过程中利用留一法交叉验证(LOOCV)优化了核函数的类型、惩罚系数C和不敏感函数ε.所建模型最终采用了227个变量中的7个:dChivps9, ESHaaCH,EsssCH2,n2pag[1,2],degree2,I'3和I'4。所得SVR模型的预测相对误差为0.0622,小于多元线性回归(MLR)和偏最小二乘法(PLS),以及文献报道模型的预测相对误差。  相似文献   

7.
计算出体系中烷基硫醇化合物的各种结构参数,以优选出的分子连接性指数和量化参数为结构描述符,首次采用反向传播算法(BP)人工神经网络、径向基函数网络(RBF)2种非线性方法建立了参数少且精度高的定量结构-色谱保留相关(QSRR)模型,预测了烷基硫醇在4种极性固定上的气相色谱保留指数(RJ)。结果表明:在4种固定相上建立的BP模型均优于RBF模型且非线性方法(BP、RBF)优于文献中多元线性回归(MLR)方法,所建定量结构保留关系(QSRR)模型具有良好的稳定性和预测能力。  相似文献   

8.
针对高炉铁水硅含量难以在线检测的问题, 本文提出一种基于改进灰狼算法(IGWO)优化的多核极限学习 机(MKELM)高炉铁水硅含量预测建模方法. 首先, 针对灰狼算法(GWO)寻优能力的不足, 将最优–最差正交反向学 习(OWOOBL)策略应用于灰狼算法的位置更新, 得到一种改进灰狼优化算法. 通过10种标准函数对所提算法进行 仿真测试, 结果表明此算法具有更好的寻优能力. 其次, 针对单核极限学习机(KELM)回归能力不足, 将不同种类的 核函数加权组合, 并采用改进灰狼算法对多核极限学习机中的加权系数等参数进行优化. 最后, 基于某钢厂的实测 数据对高炉铁水硅含量进行预测建模, 仿真结果表明, 本文所提方法的预测效果优于反向传播神经网络(BP–NN)、 极限学习机(ELM)、KELM和GWO–MKELM, 对高炉炼铁具有较好的指导意义.  相似文献   

9.
在大规模无监督语料上的BERT、XLNet等预训练语言模型,通常采用基于交叉熵损失函数的语言建模任务进行训练。模型的评价标准则采用困惑度或者模型在其他下游自然语言处理任务中的性能指标,存在损失函数和评测指标不匹配等问题。为解决这些问题,该文提出一种结合强化学习的对抗预训练语言模型RL-XLNet(Reinforcement Learning-XLNet)。RL-XLNet采用对抗训练方式训练一个生成器,基于上下文预测选定词,并训练一个判别器判断生成器预测的词是否正确。通过对抗网络生成器和判别器的相互促进作用,强化生成器对语义的理解,提高模型的学习能力。由于在文本生成过程中存在采样过程,导致最终的损失无法直接进行回传,故提出采用强化学习的方式对生成器进行训练。基于通用语言理解评估基准(GLUE Benchmark)和斯坦福问答任务(SQuAD 1.1)的实验,结果表明,与现有BERT、XLNet方法相比,RL-XLNet模型在多项任务中的性能上表现出较明显的优势: 在GLUE的六个任务中排名第1,一个任务排名第2,一个任务排名第3。在SQuAD 1.1任务中F1值排名第1。考虑到运算资源有限,基于小语料集的模型性能也达到了领域先进水平。  相似文献   

10.
应用ChemOffice 8.0中的MOPAC-PM3算法计算得到多溴联苯醚(PBDEs)的6个量子化学参数,采用基于多项式核,径向基核及Sigmoid核的支持向量机(SVM)方法建立了23种PBDEs蒸汽压的QSPR模型.三类核函数对训练集拟合的相关系数R2分别为0.994,0.996,0.994.,均方误差MSE分别为0.0102,0.0081,0.0095;留一法交叉验证(LOO)的相关系数分别为0.992,0.991,0.991.对测试集进行同归的相关系数分别为0.994,0.986,0.991,均方误差MSE分别为0.0225,0.0458,0.0247.结果表明SVM回归算法在PBDEs蒸汽压的QSPR建模上表现出色,核函数的选择对SVM模犁性能影响不显著.文章还从模型拟合效果、预测能力及稳定性三方面比较了三类核函数的整体性能,并比较了支持向量数目对核函数预测能力的影响.结果表明多项式核与Sigmoid核性能相当,优于径向基核.  相似文献   

11.
QSAR研究中,判断模型预测能力至关重要。长期以来,模型的预测能力是使用留一法或留k法等内部验证来确定,但在2004年形成的OECD规则中,已明确规定必须使用外部验证集去评价模型的预测能力。为了研究内部验证和外部验证与模型预测能力之间的关系,本文以45种睾酮和二氢睾酮衍生物以及37种萘锟酯衍生物为研究对象,以E-Dragon计算的分子描述符作为自变量,在增n减l算法选择变量的基础上,采用SVM算法对同种物质的不同活性以及不同物质的不同活性建立QSAR模型,研究QSAR/QSPR建模时的不同验证方式与模型预测能力的关系。研究结果表明,模型的预测能力与内部验证结果的好坏无必然联系,而结合外部验证的检验结果则是判断模型预测能力的可靠依据。  相似文献   

12.
ContextRecently, network measures have been proposed to predict fault-prone modules. Leveraging the dependency relationships between software entities, network measures describe the structural features of software systems. However, there is no consensus about their effectiveness for fault-proneness prediction. Specifically, the predictive ability of network measures in effort-aware context has not been addressed.ObjectiveWe aim to provide a comprehensive evaluation on the predictive effectiveness of network measures with the effort needed to inspect the code taken into consideration.MethodWe first constructed software source code networks of 11 open-source projects by extracting the data and call dependencies between modules. We then employed univariate logistic regression to investigate how each single network measure was correlated with fault-proneness. Finally, we built multivariate prediction models to examine the usefulness of network measures under three prediction settings: cross-validation, across-release, and inter-project predictions. In particular, we used the effort-aware performance indicators to compare their predictive ability against the commonly used code metrics in both ranking and classification scenarios.ResultsBased on the 11 open-source software systems, our results show that: (1) most network measures are significantly positively related to fault-proneness; (2) the performance of network measures varies under different prediction settings; (3) network measures have inconsistent effects on various projects.ConclusionNetwork measures are of practical value in the context of effort-aware fault-proneness prediction, but researchers and practitioners should be careful of choosing whether and when to use network measures in practice.  相似文献   

13.
Network measures are useful for predicting fault-prone modules. However, existing work has not distinguished faults according to their severity. In practice, high severity faults cause serious problems and require further attention. In this study, we explored the utility of network measures in high severity faultproneness prediction. We constructed software source code networks for four open-source projects by extracting the dependencies between modules. We then used univariate logistic regression to investigate the associations between each network measure and fault-proneness at a high severity level. We built multivariate prediction models to examine their explanatory ability for fault-proneness, as well as evaluated their predictive effectiveness compared to code metrics under forward-release and cross-project predictions. The results revealed the following: (1) most network measures are significantly related to high severity fault-proneness; (2) network measures generally have comparable explanatory abilities and predictive powers to those of code metrics; and (3) network measures are very unstable for cross-project predictions. These results indicate that network measures are of practical value in high severity fault-proneness prediction.  相似文献   

14.
可见光—近红外光谱估算三江源区不同土壤全氮含量   总被引:1,自引:0,他引:1  
近年来可见光—近红外反射光谱已被广泛应用于估算土壤全氮含量,为大范围区域土壤全氮含量获取提供了一种快速、有效的方法。基于实验室测定的三江源区146个表层土壤(0~30cm)样品的反射光谱数据(350~2 500nm)与全氮含量数据;利用偏最小二乘回归(PLSR)和反向传播神经网络(BPNN)两种模型方法与光谱反射率(REF)及其4种数学预处理变换相结合,分别建立分土壤类型样本和总体样本全氮估算模型;评估利用可见光—近红外光谱技术预测三江源区土壤全氮含量的能力。结果表明:BPNN模型的R2cal、R2val及验证RPD的平均值分别为0.87、0.81与2.28;而PLSR模型则相应为0.75、0.72和1.95;表明BPNN模型预测能力整体上要优于PLSR模型。BPNN与光谱各种形式的结合均具有良好、或接近良好预测全氮的能力;而PLSR与REF、倒数对数(Log(1/R))及波段深度(BD)的结合仅少部分具有良好估算能力、大部分则为粗略估算能力,一阶微分(FDR)和二阶微分(SDR)估算精度均较低,尤其是SDR(R20.5,RPD=1.10~1.27)均不具备估算能力。总体样本所建模型稳定性好于分土壤类型,分土壤类型建模差异性明显;此外,总体来看,BPNN模型比PLSR建模精度高、模型稳定性好,但PLSR模型可操作性强于BPNN模型。  相似文献   

15.
在H.264视频编解码标准中,帧内4×4亮度块的预测模式有9种。在对这些预测模式的预测能力进行分析后.发现在不同帧内预测模式预测能力存在差异。为了解决这一问题,提出了一种更改编解码次序的方法对预测能力较差的模式进行编解码。实验结果表明该方法可以使预测能力较差的模式的预测能力得到改善.  相似文献   

16.
针对额外提取数据特征的方法需要花费大量时间和人力成本,轴承退化的线性预测精度低等问题,以及时序数据具有时间依赖关系的特点,提出了端到端的结合长短时记忆网络的深度变分自编码器模型(E2E Deep VAE-LSTM)用于轴承退化预测。通过改进VAE的结构,并结合LSTM,该模型可以在含有异常值的数据集上直接进行训练和预测;使用系统重建误差表征轴承退化趋势,实现了轴承退化的非线性预测。在三个真实数据集上的实验结果表明,E2E Deep VAE-LSTM模型可以得到满意的预测结果,预测精度均高于现有的几种AE类模型及其他几种方法,且具有良好的泛化能力和抗过拟合能力。  相似文献   

17.
LS—SVM在混沌时间序列预测中的应用   总被引:9,自引:0,他引:9  
孙德山  吴今培 《微机发展》2004,14(1):21-22,25
支持向量机是一种基于统计学习理论的新颖的机器学习方法,该方法已广泛用于解决分类和回归问题。文中将最小二乘支持向量机算法应用于混沌时间序列预测中,并同BP网络及RBF网络的预测结果进行了比较分析。仿真实验表明,该方法具有很好的泛化能力和一定的噪声容忍能力。  相似文献   

18.
神经网络用于三元分子混合物密度与粘度的预测   总被引:5,自引:3,他引:2  
以二元系实验为基础,利用反向转播算法训练神经网络,构造混合物组成,温度等与物性关系的模型,用于对4个三元混合物体系(1)邻二甲苯-间二甲苯-对二甲苯;(2)四氯化碳-环己烷-2-丙醇;(3)甲醇-丙酮-水;(4)水-甲醇-乙二醇的密度和5个三元混合物体系(1)信甲苯-间二甲苯-对二甲苯;(2)四氯化碳-环己烷-2-丙醇;(3)氯仿-2-丙醇-2-丁醇;(4)甲醇-丙酮-水;(5)乙醇-甲醇-水的粘  相似文献   

19.
Detection of radiological accidents and monitoring the spread of the contamination is of great importance. Following the Chernobyl accident many European countries have installed monitoring networks to perform this task. Real-time availability of automatically interpolated maps showing the spread of radioactivity during and after an accident would improve the capability of decision makers to accurately respond to a radiological accident. The objective of this paper is to present a real-time automatic interpolation system suited for natural background radioactivity. Interpolating natural background radiation allows us to better understand the natural variability, thus improving our ability to detect accidents. A real-time automatic interpolation system suited for natural background radioactivity presents a first step towards a system that can deal with radiological accidents. The interpolated maps are produced using a combination of universal kriging and an automatic variogram fitting procedure. The system provides a map of (1) the kriging prediction, (2) the kriging standard error and (3) the position of approximate prediction intervals relative to a threshold. The maps are presented through a Web Map Service (WMS) to ensure interoperability with existing Geographic Information Systems (GIS).  相似文献   

20.
刘西振  杨静  王威 《计算机工程》2012,38(7):257-259,262
在使用硬件电路进行H.264编码时,为提高帧内预测运算速度,减少硬件电路面积,提出一种基于现场可编程门阵列(FPGA)的H.264帧内预测硬件电路的实现和优化解决方案。利用FPGA的并行处理能力和同模式下帧内预测数据冗余对硬件电路进行优化。使用Verilog语言进行模块设计,仿真平台为Modelsim,在Altera CycloneII EP2C20F484C上的实现,验证了该硬件电路结构的高效性及实用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号