首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
杨杰  燕雪峰  张德平 《计算机科学》2017,44(8):176-180, 206
Boosting重抽样是常用的扩充小样本数据集的方法,首先针对抽样过程中存在的维数灾难现象,提出随机属性子集选择方法以进行降维处理;进而针对软件缺陷预测对于漏报与误报的惩罚因子不同的特点,在属性选择过程中添加代价敏感算法。以多个基本k-NN预测器为弱学习器,以代价最小为属性删除原则,得到当前抽样集的k值与属性子集的预测器集合,采用代价敏感的权重更新机制对抽样过程中的不同数据实例赋予相应权值,由所有预测器集合构成自适应的集成k-NN强学习器并建立软件缺陷预测模型。基于NASA数据集的实验结果表明,在小样本情况下,基于Boosting的代价敏感软件缺陷预测方法预测的漏报率有较大程度降低,误报率有一定程度增加,整体性能优于原来的Boosting集成预测方法。  相似文献   

2.
软件缺陷预测是改善软件开发质量,提高测试效率的重要途径.文中提出一种基于软件度量元的集成k-NN软件缺陷预测方法.首先,该方法在不同的Bootstrap抽样数据集上迭代训练生成一个基本k-NN预测器集合.然后,这些基本预测器分别对软件模块进行独立预测,各基本预测值将被融合生成最终的预测结果.为判别新的软件模块是否为缺陷模块,设计分类阈值的自适应学习方法.集成预测结果大于该阈值的模块将被识别为缺陷模块,反之则为正常模块.NASAMDP及PROMISEAR标准软件缺陷数据集上的实验结果表明集成k-NN缺陷预测的性能较之广泛采用的对比缺陷预测方法有较明显的提高,同时也证明软件度量元在缺陷预测中的有效性.  相似文献   

3.
软件故障静态预测方法综述   总被引:2,自引:0,他引:2  
软件故障静态预测通过从项目数据中提取度量信息预测故障,以便于测试和验证资源的分配。从可用度量数据和预测模型两个方面总结了软件故障静态预测方法,可用度量包括方法层、类层、构件层、文件层以及过程层度量,预测模型分为机器学习和统计方法两类;总结了性能评价指标、度量数据可得性以及故障分类对故障预测的影响等需要进一步研究的问题。  相似文献   

4.
基于Bagging的组合k-NN预测模型与方法   总被引:1,自引:0,他引:1  
k-近邻方法基于单一k值预测,无法兼顾不同实例可能存在的特征差异,总体预测精度难以保证.针对该问题,提出了一种基于Bagging的组合k-NN预测模型,并在此基础上实现了具有属性选择的Bgk-NN预测方法.该方法通过训练建立个性化预测模型集合,各模型独立生成未知实例预测值,并以各预测值的中位数作为组合预测结果.Bgk-NN预测可适用于包含离散值属性及连续值属性的各种类型数据集.标准数据集上的实验表明,Bgk-NN预测精度较之传统k-NN方法有了明显提高.  相似文献   

5.
1 引言 Boosting由Freund和Schapire于1990年提出,是提高预测学习系统预测能力的有效工具,也是组合学习中最具代表性的方法,其代表算法可分为Boost-by-majority和AdaBoost两个系列。Boosting操纵训练例子以产生多个假设。从而建立通过投票结合的预测器集合。Boosting在训练例子上维护一套概率分布。Boost-by-majority通过在每一回迭  相似文献   

6.
不合理的车辆的换道行为是导致交通事故发生的主要原因之一,提前预知换道车辆的轨迹并及时做出相应调整有助于减少事故的发生。针对换道车辆轨迹预测问题,采用将深度学习和集成学习相结合的轨迹预测方法,并考虑了换道意图的影响。建立连续隐马尔可夫模型对车辆进行换道意图检测,提前判别车辆的换道状态,并输入至相应的轨迹预测模型中;将LSTM(long short term memory)作为AdaBoost算法(adaptive boosting)的基预测器,建立LSTM-AdaBoost模型,在多个基预测器同时进行轨迹预测的基础上,通过训练调整各个基预测器的权重并将结果加权集成,提升预测模型的精度和稳定性;通过NSGIM(next generation simulation)数据集对模型进行训练和测试,结果显示意图预测模型在变道前一秒的准确率在90%以上,LSTM-AdaBoost集成轨迹预测模型与单一的LSTM模型相比精度和稳定性显著提升,且预测结果中异常数据更少,具有较好的稳定性;同时预测对比结果也表明增加意图预测模块有助于提升换道轨迹预测的精度。  相似文献   

7.
针对软件缺陷预测中不平衡数据的分类问题,提出了一种基于过采样和集成学习的类不平衡软件缺陷预测模型XG-AJCC(AJCC-Ram+XGBoost).在预处理阶段,提出了AJCC-Ram(Adaptive Judgment Cure Clustering Random Sampling)多层次过采样方法.该方法基于改进的ADASYN自适应过采样和CURE-SMOTE过采样分别在类边缘和类中心层面生成新样本,通过CLNI方法对样本生成后的数据集进行噪声过滤及清理.在模型构建阶段,与集成算法XGBoost(eXtreme Gradient Boosting)相结合形成最终的不平衡数据缺陷预测模型.本文在AEEEM数据集和NASA数据集中进行了验证,实验结果表明:较于经典的采样方法和采样集成预测模型,在F1指标上AJCC-Ram过采样方法及XG-AJCC采样集成算法模型均能够取得有效的预测结果.  相似文献   

8.
软件故障预测中若采用大量度量指标建立预测模型,可能因其中含有无关特征使预测模型性能受到不良影响,故障预测中的特征选择步骤选取一定维度的部分故障数据建立预测模型来提高模型性能,以达到压缩特征维度,提高模型预测精度,降低预测模型复杂度,节约计算资源的目的。传统特征排序方法仅评估单个特征对类标的影响,建立的预测模型有效性较低;特征子集选择方法需搜索所有特征子集,耗费计算资源且所选特征维数较高。针对以上问题,提出一种基于拓展贝叶斯信息准则的特征选择方法(EBIC-FS),该方法对数据进行线性回归,并计算出残差平方和较小且数据维数较少的特征模型。在公开数据集M&R及Promise上进行实验,结果表明该方法能有效压缩特征维度,且预测模型性能与5种基线方法相比有较大提升。  相似文献   

9.
针对常规故障预测方法难以分析复合故障的情况下各个故障对系统的交互作用、难以分析装备数据复杂特征、难以实时准确预测故障等现状,对现代大数据和人工智能方法应用在故障预测领域进行研究,提出基于深度学习的故障预测技术,将系统故障预测可分为动态预测和静态预测。利用深度学习算法处理装备状态监测和试验验证获得的海量故障数据,通过故障模型训练、故障特征识别、故障演化规律获取来对系统进行在线动态预测;针对软件故障突变特性,利用软件质量特征属性进行静态故障预测;同时,提出使用开源深度学习框架TensorFlow进行系统研制方法。通过基于深度学习的故障预测技术,能够提高装备故障预测能力。  相似文献   

10.
针对污水处理过程中水质参数COD指标难以在线检测的问题,提出一种基于分布式改进BP神经网络和灰色预测的COD指标集成软测量模型。为反映污水处理过程的不同工况,采用满意聚类算法对数据样本进行聚类处理,将数据样本划分为若干个子样本集,利用改进BP神经网络方法分别为每个子样本集建立预测模型,计算当前输入数据与各个聚类中心的欧式距离,将欧式距离较小的部分预测模型的输出进行综合,得到分布式神经网络的COD指标预估值;为反映COD指标的时间相关性,基于COD指标历史数据采用改进灰色预测建模方法计算得到当前时刻COD指标的预估值;采用动态加权方法将获得两个COD指标预估值进行加权集成。仿真实验表明,集成软测量模型具有较好的预测性能,可以满足污水处理过程COD指标实时检测的精度要求。  相似文献   

11.
针对污水处理过程存在着强非线性和非稳态运行等特征,传统传感器维护成本高昂且无法快速准确地测量生化需氧量(BOD)等水质指标的问题,提出一种基于集成相关向量机的水质在线预测模型。该模型首先采用相关向量机(RVM)为弱预测器,利用改进的AdaBoost.RT算法将多个弱预测器集成为强预测器,实现了污水处理过程中水质的在线预测。仿真实验结果表明,该水质在线预测模型预测精度高,综合性能突出,克服了单一预测器随着异常点增多,模型泛化能力下降和鲁棒性不足的问题,能较好地实现了污水处理过程中的水质在线预测。  相似文献   

12.
软件缺陷预测可以有效提高软件的可靠性,修复系统存在的漏洞。Boosting重抽样是解决软件缺陷预测样本数量不足问题的常用方法,但常规Boosting方法在处理领域类不平衡问题时效果不佳。为此,提出一种代价敏感的Boosting软件缺陷预测方法CSBst。针对缺陷模块漏报和误报代价不同的问题,利用代价敏感的Boosting方法更新样本权重,增大产生第一类错误的样本权重,使之大于无缺陷类样本权重与第二类错误样本的权重,从而提高模块的预测率。采用阈值移动方法对多个决策树基分类器的分类结果进行集成,以解决过拟合问题。在此基础上,通过分析给出模型构建过程中权重和阈值的最优化设置。在NASA软件缺陷预测数据集上进行实验,结果表明,在小样本的情况下,与CSBKNN、CSCE方法相比,CSBst方法的BAL预测指标分别提升7%和3%,且时间复杂度降低一个数量级。  相似文献   

13.
许生  喻泽林  常坤  吴玉宁  龙兵 《测控技术》2016,35(8):111-114
通过分析机载软件无线电系统的结构特性,为满足其高可靠性高灵活性等要求,设计并实现了针对机载软件无线电系统的故障预测软件平台.该软件平台在MFC框架基础上进行开发,集成了自回归预测模型(AR)、灰色预测模型(GM(1,1))等预测算法,并对预测算法关键参数进行优化,使得该软件能够根据不同预测对象,以及不同预测精度要求自动选择最佳预测算法进行故障预测.同时,可根据需要在线升级已有预测算法或动态加载新的预测模型,提出并实现了一种适用可靠的开放式故障预测系统.  相似文献   

14.
实际生活中,经常会遇到大规模数据的分类问题,传统k-近邻k-NN(k-Nearest Neighbor)分类方法需要遍历整个训练样本集,因此分类效率较低,无法处理具有大规模训练集的分类任务。针对这个问题,提出一种基于聚类的加速k-NN分类方法 C_kNN(Speeding k-NN Classification Method Based on Clustering)。该方法首先对训练样本进行聚类,得到初始聚类结果,并计算每个类的聚类中心,选择与聚类中心相似度最高的训练样本构成新的训练样本集,然后针对每个测试样本,计算新训练样本集中与其相似度最高的k个样本,并选择该k个近邻样本中最多的类别标签作为该测试样本的预测模式类别。实验结果表明,C_k-NN分类方法在保持较高分类精度的同时大幅度提高模型的分类效率。  相似文献   

15.
变压器油击穿电压的预测,对于变压器的故障诊断和日常维护具有重要的意义。本文提出了1种击穿电压多参数关联预测方法,即通过对变压器油日常监督数据进行灰色关联分析,挖掘与击穿电压存在强关联性的指标;利用BP网络建立击穿电压与4个强关联性指标的关系模型;采用模糊C均值聚类算法聚类原始样本,以聚类中心训练网络,以解决大样本情况引起的网络结构复杂、收敛性及泛化能力差等神经网络固有问题。仿真结果表明,预测模型精度较高,预测值与实际值的相对误差均在10%以内,能够满足实际应用要求,具有重要的应用价值。  相似文献   

16.
针对智能电表故障状态的预测问题,提出了一种基于Apriori算法和C5.0算法建立智能电表故障识别模型,实现智能电表故障的预测。首先,对智能电表历史故障数据库进行数据挖掘预处理,并采用Apriori算法进行强关联因素深度挖掘。然后,将强关联因素组成的数据集合分为训练数据集和测试数据集两部分,采用C5.0算法对训练数据集进行数据挖掘,生成智能电表故障初步预测规则。接着,根据测试集的数据对初步预测规则的正确性进行评估:如果准确度满足要求,确定预测规则;如果不满足,则返回训练集。最后,根据获得的预测规则建立智能电表故障状态预测模型进行智能电表故障预测。算例分析结果证明,智能电表故障状态预测模型具有较高的精度,可获得极为准确的故障状态预测结果。  相似文献   

17.
提出了一种基于四叉树K-均值聚类算法的软件故障预测算法.采用四叉树的目的包括利用四叉树寻找K-均值聚类算法所需要的聚类中心和利用四叉树来进行软件模块的故障预测.在这种算法中,输入门限参数决定了最初的聚类中心,通过改变门限参数,用户可以得到期望的聚类中心.采用了聚类收益这个新的标准来衡量算法的性能.通过仿真和比较,算法具有最高的聚类收益,且在大多数情况下,总体错误率比其他算法更低,从而表明了算法在软件故障预测中的有效性.  相似文献   

18.
Boosting家族AdaBoost系列代表算法   总被引:13,自引:0,他引:13  
1 引言 Boosting由Freund和Schapire于1990年提出,是提高预测学习系统预测能力的有效工具,也是组合学习中最具代表性的方法。其代表算法可分为Boost-by-majority和AdaBoost两个系列。Boosting操纵训练例子以产生多个假设,从而建立通过投票结合的预测器集合。AdaBoost在训练例子上维护一套概率分布,在每一回迭代中AdaBoost在每个例子上调整这种分布,成员分类器在训练例子上的错误率被计算出来并以此在训练例子上调整概率分布。权重改变的作用是在被误分的例子上放置更多的权重,在分类正确的例子上减  相似文献   

19.
污水处理过程生化需氧量智能集成软测量模型   总被引:1,自引:0,他引:1  
针对污水处理过程中生化需氧量(BOD)难以在线检测的问题,提出一种基于满意聚类和改进SVM的BOD智能集成软测量建模方法.采用满意聚类算法对预处理后的数据样本进行聚类分析,利用改进SVM为每个聚类样本建立BOD子预测模型,并采用模糊组合方法获得最终的BOD预测值.仿真试验表明,该方法预测精度高,能够满足污水处理过程对BOD检测的实际要求.  相似文献   

20.
王丹丹  王青 《软件学报》2016,27(12):3014-3029
软件持续演化已经是不争的事实,演化意味着需求的变化,也就必然导致了缺陷的不断产生.现有的缺陷预测技术多偏重于基于软件工作制品,如文档、代码、测试用例等的属性来预测缺陷,但如果把软件看作一种物种,其生命周期内的演化本质上是一个物种的逐步进化,其缺陷的表现也必然带着该物种的特征,而且还受到进化历史中的演化轨迹的影响.已有一些研究人员开始研究软件演化过程,并提出了一些演化度量元.研究和提出了可以刻画软件演化轨迹的两类演化度量元,并通过案例研究,建立缺陷预测模型.在6个著名开源软件数据集上训练和验证了由软件演化度量元建立的缺陷预测模型,获得了良好的预测性能,验证了演化度量元对缺陷预测性能的改进.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号