首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
2.
代价敏感属性选择问题的目的是通过权衡测试代价和误分类代价,得到一个具有最小总代价的属性子集。目前,多数代价敏感属性选择方法只考虑误分类代价固定不变的情况,不能较好地解决类分布不均衡等问题。而在大规模数据集上,算法效率不理想也是代价敏感属性选择的主要问题之一。针对这些问题,以总代价最小为目标,设计了一种新的动态误分类代价机制。结合分治思想,根据数据集规模按列自适应拆分各数据集。基于动态误分类代价重新定义最小代价属性选择问题,提出了动态误分类代价下的代价敏感属性选择分治算法。通过实验表明,该算法能在提高效率的同时获得最优误分类代价,从而保证所得属性子集的总代价最小。  相似文献   

3.
王运博  冯刚强  张诗友  韩一石 《计算机仿真》2021,38(10):301-305,310
针对传统分类算法无法有效解决高度不平衡移动网络视频流U-vMOS分类问题,提出基于代价敏感(cost-sensitive)思想改进AdaBoost算法构造U-vMOS分类器,在迭代过程中,于样本权重更新环节引人代价敏感因子,增加对少数类(mi-nority)关注,最终 U-vMOS 分类器获得优秀 的查准率和查全率.实验结果表明,在数据非均衡条件下,改进AdaBoost算法F-Measure值和稳定性明显优于其它算法,能够为运营商和视频产业链提升用户体验给出有用的指导建议.  相似文献   

4.
多分类问题代价敏感AdaBoost算法   总被引:8,自引:2,他引:6  
付忠良 《自动化学报》2011,37(8):973-983
针对目前多分类代价敏感分类问题在转换成二分类代价敏感分类问题存在的代价合并问题, 研究并构造出了可直接应用于多分类问题的代价敏感AdaBoost算法.算法具有与连续AdaBoost算法 类似的流程和误差估计. 当代价完全相等时, 该算法就变成了一种新的多分类的连续AdaBoost算法, 算法能够确保训练错误率随着训练的分类器的个数增加而降低, 但不直接要求各个分类器相互独立条件, 或者说独立性条件可以通过算法规则来保证, 但现有多分类连续AdaBoost算法的推导必须要求各个分类器相互独立. 实验数据表明, 算法可以真正实现分类结果偏向错分代价较小的类, 特别当每一类被错分成其他类的代价不平衡但平均代价相等时, 目前已有的多分类代价敏感学习算法会失效, 但新方法仍然能 实现最小的错分代价. 研究方法为进一步研究集成学习算法提供了一种新的思路, 得到了一种易操作并近似满足分类错误率最小的多标签分类问题的AdaBoost算法.  相似文献   

5.
软件缺陷预测是提高软件测试效率,保证软件可靠性的重要途径。考虑到软件缺陷预测模型对软件模块错误分类代价的不同,提出了代价敏感分类的软件缺陷预测模型构建方法。针对代码属性度量数据,采用Bagging方式有放回地多次随机抽取训练样本来构建代价敏感分类的决策树基分类器,然后通过投票的方式集成后进行软件模块的缺陷预测,并给出模型构建过程中代价因子最优值的判定选择方法。使用公开的NASA软件缺陷预测数据集进行仿真实验,结果表明该方法在保证缺陷预测率的前提下,误报率明显降低,综合评价指标AUC和F值均优于现有方法。  相似文献   

6.
一种新的代价敏感分类方法   总被引:1,自引:0,他引:1  
代价敏感学习(cost-sensitive learning)是指在机器学习的过程中考虑不同的误判(misclassification)带来的不同的代价(cost).论文将一项最新的贝叶斯分类研究成果应用到代价敏感学习中,提出了一种新的称之为代价敏感隐藏朴素贝叶斯分类算法.实验表明该方法比另一种典型的代价敏感算法更有效.  相似文献   

7.
代价敏感分类算法的实验比较   总被引:1,自引:0,他引:1  
对8种不同代价敏感分类算法进行了比较研究.目的是通过实验手段,分析不同代价敏感算法的行为和当其归纳过程发生变化时,对错误分类的总代价、高代价错误数量和错误的总数量所产生的影响.对其中的Ada-Cost方法,本文分析了为何其代价调整因子可能对其性能带来负面影响,并实现了2种变体方法,提高了其性能.  相似文献   

8.
针对传统的基于遗传神经网络的入侵检测模型未考虑误分类代价的不足,将误分类代价敏感的特征集成到基于遗传神经网络的网络入侵检测模型中,从而克服了传统模型中错误分类时可能导致代价过大的缺点。通过实验结果表明,增加了误分类代价敏感特征后的遗传神经网络能较好地控制网络入侵检测系统误报、漏报攻击时所产生的代价。  相似文献   

9.
阮晓宏  黄小猛  袁鼎荣  段巧灵 《计算机科学》2013,40(Z11):140-142,146
代价敏感学习方法常常假设不同类型的代价能够被转换成统一单位的同种代价,显然构建适当的代价敏感属性选择因子是个挑战。设计了一种新的异构代价敏感决策树分类器算法,该算法充分考虑了不同代价在分裂属性选择中的作用,构建了一种基于异构代价的分裂属性选择模型,设计了基于代价敏感的剪枝标准。实验结果表明,该方法处理代价机制和属性信息的异质性比现有方法更有效。  相似文献   

10.
乳腺癌已经成为当今世界影响妇女健康的重要疾病。对于乳腺癌诊断来说,当一个恶性病例被误分类为良性病例的时候,其代价远远大于一个良性病例被误分类为恶性病例。它利用数据挖掘领域的代价敏感相关方法,建立一个识别良性乳腺肿瘤和恶性乳腺肿瘤的诊断预测系统。在建模过程中充分考虑到误分类代价的因素,提出了误分类代价策略。通过一系列实验验证了所建立的模型。从实验结果来看,Adaboost与SVM的误分类组合分类算法在正确率和总误分类代价两个评估指标上得到了良好的效果。  相似文献   

11.
现实生活中存在大量的非平衡数据,大多数传统的分类算法假定类分布平衡或者样本的错分代价相同,因此在对这些非平衡数据进行分类时会出现少数类样本错分的问题。针对上述问题,在代价敏感的理论基础上,提出了一种新的基于代价敏感集成学习的非平衡数据分类算法--NIBoost(New Imbalanced Boost)。首先,在每次迭代过程中利用过采样算法新增一定数目的少数类样本来对数据集进行平衡,在该新数据集上训练分类器;其次,使用该分类器对数据集进行分类,并得到各样本的预测类标及该分类器的分类错误率;最后,根据分类错误率和预测的类标计算该分类器的权重系数及各样本新的权重。实验采用决策树、朴素贝叶斯作为弱分类器算法,在UCI数据集上的实验结果表明,当以决策树作为基分类器时,与RareBoost算法相比,F-value最高提高了5.91个百分点、G-mean最高提高了7.44个百分点、AUC最高提高了4.38个百分点;故该新算法在处理非平衡数据分类问题上具有一定的优势。  相似文献   

12.
静态分析工具可以帮助开发人员在项目编码初期定位可能存在缺陷的代码。然而有研究表明,此类工具往往会报告大量的警告,且其中大部分为误报警告。为了增强静态分析工具的可用性,研究者们通常采用统计和机器学习方法将警告分类为有效警告和误报警告。然而,现有警告分类方法并未考虑大量误报警告造成警告数据类不平衡问题,以及误分类代价不等的问题。鉴于此,分别将BP神经网络和基于过采样、阈值操作、欠采样方法的代价敏感神经网络应用到有效警告的分类中。实验结果对比发现,相比BP神经网络,基于代价敏感神经网络方法在有效警告查全率方面平均提高了44.07%,且当有效警告被误分类的代价高于一定值时,代价敏感分类方法能得到更低的分类代价。  相似文献   

13.
刘星毅 《计算机应用》2009,29(3):839-842
代价敏感决策树通常讨论测试代价和误分类代价,在其分类过程中,最关键的是节点分裂属性的选择。分析了代价敏感决策树分类问题目前常见的选择分裂属性方法的优、缺点,提出了综合信息量和测试代价并且最大程度降低误分类代价的分裂属性选择方法,UCI数据集实验结果显示该方法在各个方面好于已有的方法。  相似文献   

14.
针对自适应IIR滤波器潜在的不稳定性和性能指标函数容易陷入局部极小点而导致性能下降等问题,用一种新的优化算法-微粒群算法来对自适应IIR滤波器进行优化设计,它不依赖于梯度信息,能够有效地实现自适应IIR滤波器参数的全局寻优,仿真结果表明用微粒群算法进行参数寻优优于遗传算法,不仅解决了自适应滤波器性能指标函数容易陷入局部极小点的问题,也解决了稳定性问题。  相似文献   

15.
综述了基于超曲面的分类算法,该算法通过区域合并计算获得多个超平面组成的双侧闭曲面作为分类超曲面对空间进行划分.分类超曲面可以有效地解决在有限连通区域分布很复杂的非线性数据多类分类问题,分析了算法准确率与极小样本集的关系,总结了已有成就和最新进展,指出了基于超曲面的分类算法进一步发展的方向.  相似文献   

16.
遗传算法在函数寻优领域得到了广泛应用,选取合适的参数对提高遗传算法寻优性能至关重要。以四个经典函数为例,基于正交试验原理分析了遗传算法五个参数对其寻优时间和迭代次数的影响。结果表明:对寻优搜索时间影响最大的参数为变异概率,其次为种群大小,交叉算子的选择、交叉概率和编码长度影响相对较小;对寻优迭代次数影响较大的三个参数为变异概率、种群大小和编码长度,而交叉概率和交叉算子的选择影响相对较小。分析了使遗传算法性能最优时参数组合的原则。  相似文献   

17.
为提高不平衡数据的分类性能,提出了基于度量指标优化的不平衡数据Boosting算法。该算法结合不平衡数据分类性能度量标准和Boosting算法,使用不平衡数据分类性能度量指标代替原有误分率指标,分别采用带有权重的正类和负类召回率、F-measure和G-means指标对Boosting算法进行优化,按照不同的度量指标计算Alpha 值进行迭代,得到带有加权值的弱学习器组合,最后使用Boosting算法进行优化。经过实验验证,与带有权重的Boosting算法进行比较,该算法对一定数据集的AUC分类性能指标有一定提高,错误率有所下降,对F-measure和G-mean性能指标有一定的改善,说明该算法侧重提高正类分类性能,改善不平衡数据的整体分类性能。  相似文献   

18.
为提高供应链物流管理服务水平,基于帕累托定律,运用规范列平均法和优化理论建立了基于多重分类准则模型。通过有效利用混沌遗传和蚁群优化算法在组合优化中的优势,给出了混沌遗传蚁群优化算法,采用混沌搜索优化初始群体、修正变异算子、蚁群算法寻优优化、改进相关参数等实现了两种算法的有机集成。物流案例实证表明了混沌遗传蚁群算法在解决多重分类准则优化模型方面的有效性。  相似文献   

19.
徐署华  江文  黄志刚 《计算机应用》2007,27(8):1997-2000
Web服务已成为一种松散连接系统间共享数据和功能的标准方法。基于瓶颈开销度量方式提出了一种算法,以最佳方式排列查询中的所有Web服务调用,使所有Web服务以最佳并列方式工作,减少整个查询过程的总运行时间。该算法能用于Web服务之间存在任意优先约束的情况。通过实验和其他优化方案进行比较,证明了算法的有效性。  相似文献   

20.
遗传算法( Genetic Algorithm,GA)是一种模拟生物界自然选择的智能优化算法,已经被广泛应用到各个领域。文中主要针对传统遗传算法在应用于数字电路优化设计中时所出现的未成熟收敛和收敛速度慢的问题,提出一种新的个体选择方法。该方法将保留最优个体选择方式和改进轮盘赌选择方式相结合,能够在保持种群的多样性的同时有效地提高数字电路优化的精确度。将该算法应用到最小分类网络的设计中,实验结果验证了改进算法的合理性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号