首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
稀有类分类问题探讨   总被引:1,自引:1,他引:0  
职为梅  范明 《计算机技术与发展》2010,20(7):250-252,F0003
分类是数据挖掘中的重要任务之一,稀有类分类问题是分类中的一个重要分支,可以描述为从一个分布极不平衡的数据集中标识出那些具有显著意义却很少发生的实例,在现实生活中的很多领域都有广泛的应用.详细地介绍了稀有类分类的问题,探讨了稀有类分类的一些特征、影响稀有类分类的一些因素和对稀有类分类进行评估的标准,介绍了当前分类稀有类的主要方法:基于数据集的方法和基于算法的方法.介绍了当前几种流行的稀有类分类算法.  相似文献   

2.
稀有类的分类问题在商业、金融、电信、科学研究等诸多的领域都有着广泛的应用,但是由于其难区分性、多态性、稀有性等主要的特征,使其传统的分类方法对于稀有类的分类来说,并没有良好的效果。因此对于稀有类分类问题的研究是具有理论及其实践意义的。将稀有类的现有分类算法分别进行了阐述,而且引入了专用于稀有类分类算法的评估标准。  相似文献   

3.
样本大小对稀有类分类的影响   总被引:1,自引:0,他引:1  
分类稀有类在现实生活中的很多领域都有广泛的应用,但普通的分类算法在分类稀有类时往往失效.探讨了影响稀有类分类的各个因素,针对影响稀有类中的一个因素,样本大小对稀有类的影响进行了研究.对于UCI学习库中的三个数据集,在weka平台上使用Roration Forest进行实验,对于相同的类比率,使用unsupervised resample数据预处理方法使样本由小变大.结果表明在特定的类比率下,使样本变大,由数据的不平衡分布造成的分类错误下降,普通的分类算法在分类稀有类时往往也可以取得很好的分类结果.  相似文献   

4.
职为梅  范明 《微机发展》2005,15(12):44-47
分类稀有类在现实生活中的很多领域都有广泛的应用。文中给出一种分类框架,将两阶段思想与基于eEP的分类方法结合起来对稀有类分类。在UCI机器学习库的几个稀有类数据集上的实验表明:文中的算法不仅能够取得很好的分类准确率,而且在分类稀有类时可以达到较高的召回率和精确率。可以将本算法应用于现实生活的领域中进行稀有数据的分类。  相似文献   

5.
探讨了影响稀有类分类的各个因素,针对影响稀有类中的一个因素--样本大小对稀有类的影响进行了研究.  相似文献   

6.
分类稀有类在现实生活中的很多领域都有广泛的应用.文中给出一种分类框架,将两阶段思想与基于eEP的分类方法结合起来对稀有类分类.在UCI机器学习库的几个稀有类数据集上的实验表明:文中的算法不仅能够取得很好的分类准确率,而且在分类稀有类时可以达到较高的召回率和精确率.可以将本算法应用于现实生活的领域中进行稀有数据的分类.  相似文献   

7.
稀有类识别问题在现实生活的很多方面都有广泛应用.由于数据的高度倾斜,很多传统分类算法在稀有类上效果不佳.使用一种新的集成方法,称为EDKC(ensemble of different kind of classifiers)用来分类稀有类. EDKC集成不同的分类器形成组合分类器,并且通过加权投票表决对未知样本进行分类.在UCI机器学习数据库的多个稀有类数据集上的实验结果表明,EDKC对稀有类分类不仅具有较高的F-度量值,能达到目标类召回率和精度的平衡,而且能够取得很高的分类准确率.  相似文献   

8.
传统关联分类算法使用单一最小项目支持度挖掘关联规则,导致稀有项关联规则无法被发现,从而影响分类的准确性和实用性。提出一种多支持度关联规则分类算法MS-CBAR(Multiple Supports-Classification Based on Association Rules),将多最小项目支持度模型应用于关联分类,以有效挖掘稀有项。该算法为数据库中的规则项提供了用户可定义的最小项目支持度。MS-CBAR算法使用项的最小项支持度阈值、类的最小类支持度值和规则项的最小支持度值决定分类规则是否频繁。生成分类规则集后,使用最高优先度规则覆盖法基于规则集建立分类器。实验表明,所提算法在包含稀有项目及稀有类的数据集中准确率高于传统关联分类算法及其相关算法,表现更稳定。  相似文献   

9.
提高入侵检测系统的检测率并降低误报率是一个重要的研究课题。在对稀有类分类问题研究的基础上,将集成学习应用到入侵检测中,采用对高速网络数据进行分流的检测模型,把网络数据包按照协议类型进行分类,然后交给各个检测器,每个检测器以C4.5分类器作为弱分类器,用集成学习AdaBoost算法构造一个加强的总检测函数。进一步用SMOTE技术合成稀有类,在KDD‘99数据集上进行了仿真实验,结果表明这种方法可有效提高稀有类的检测率。  相似文献   

10.
范明  刘艳霞 《计算机应用》2005,25(Z1):152-154
提出了一种新的稀有类分类方法,称作VeEPRC.该方法使用一种特殊的EP(基本显露模式,eEP)构造基于eEP的分类器,并对它们"装袋",建立有效的组合分类器VeEPRC.在UCI机器学习数据库的基准数据集上的实验表明,VeEPRC不仅对稀有类具有较高的召回率和精度,而且具有较高的分类准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号