首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
秦锋  罗慧  程泽凯  任诗流  陈莉 《计算机工程与设计》2007,28(24):5919-5920,5972
分类器评估一般采用准确性评估.理论证明,基于AUC方法评估分类器优于准确性评估方法,但该方法局限于二类分类问题.提出一种将二类分类问题推广到多类分类问题的新方法,用纠错输出码转换得到转换矩阵,通过转换矩阵把多类分类问题转换成二类分类问题,计算二类分类的平均值来评估分类器的性能.新方法在MBNC实验平台下编程实现,并评估贝叶斯分类器的性能,实验结果表明,这种方法是有效的.  相似文献   

2.
分类是数据挖掘领域研究的核心技术之一,分类器性能评估方法也是众多学者的研究热点之一。以往的分类器性能评估方法一般针对于单标签数据集,对于多标签问题并未涉及。文中主要针对多标签分类问题中的单实例情况,提出了一种多标签分类器准确性评估方法(EMOSIML)。该方法的思路是:如果分类器对一个多标签对象预测的类别标签是其属于的多个类别标签中的任何一个,则分类结果都是正确的。该方法用C#编程实现,并对朴素贝叶斯分类器进行分类器性能评估实验,实验结果表明,EMOSIML评估方法较传统的准确率评估方法更合理。  相似文献   

3.
多标签分类器准确性评估方法的研究   总被引:1,自引:0,他引:1  
分类是数据挖掘领域研究的核心技术之一,分类器性能评估方法也是众多学者的研究热点之一。以往的分类器性能评估方法一般针对于单标签数据集,对于多标签问题并未涉及。文中主要针对多标签分类问题中的单实例情况,提出了一种多标签分类器准确性评估方法(EMOSIML)。该方法的思路是:如果分类器对一个多标签对象预测的类别标签是其属于的多个类别标签中的任何一个,则分类结果都是正确的。该方法用C#编程实现,并对朴素贝叶斯分类器进行分类器性能评估实验,实验结果表明,EMOSIML评估方法较传统的准确率评估方法更合理。  相似文献   

4.
分类问题是数据挖掘领域的研究热点之一。多标签分类器可以将数据对象预测为多个类别,训练集中属性相同但对应类标签不同的对象的数目是不平衡的,而现有的评估算法并未能区分其代价。提出了一种基于不同权重的准确性评估方法EMOWDIF,根据多标签数据对象属于相同属性不同类别的数目之间的比值计算相应的权重,对分类器模型给予不同程度的奖惩,从而区分不同分类器的性能。方法用编程实现,并对多标签数据集的分类结果进行评估。实验结果表明该方法能有效评估分类器。  相似文献   

5.
多分类任务准确率评估对评判模型的分类效果具有重要的理论意义和应用价值。针对机器学习领域的多分类任务,在现有方法的基础上,通过拓展和迁移应用,给出一种新的评估方法。为了准确评估多分类任务模型的分类效果,将遥感图像分类效果评估方法引入多分类任务。针对多分类任务的实际特点,对该方法进行了改进与推广,以更好地评估分类器效能。基于MNIST手写字符集识别任务和CIFAR-10数据集分类任务的实验结果表明,同样是基于混淆矩阵进行计算,与现有的评估方法相比,该方法可以同时给出分类器整体的分类效果和单个类别的分类效果,对于改进训练过程有一定的指导意义。另一方面,该方法可以推广到任意的分类任务分类效果评估工作中,具有较好的应用前景。  相似文献   

6.
分类技术是数据挖掘研究的核心技术之一,分类评估也是研究热点,基于AUC评估方法是分类评估领域的研究热点,其中B-AUC评估算法可以有效地评估分类器性能,但该评估方法有不足之处。该分类评估方法建立在不对称的两个类别上,影响了评价结果;根据非完全二叉树思想存储,浪费了存储空间;基于偏二叉树的搜索效率不高。利用完全二叉树的构造思想提出了BO-AUC评估方法,该方法将n个类别的分类问题分解为独立的二类进行成对的计算,可以有效地解决B-AUC的不足,进一步扩展基于AUC的评估标准,在MBNC实验上编程实现该方法,实验结果表明BO-AUC方法的有效性。  相似文献   

7.
一种基于图的层次多标记文本分类方法   总被引:1,自引:0,他引:1  
由于一个类别在层次树上可能存在多个镜像,基于层次树来进行分类可能会导致不一致性。一种自然的解决方法是采用图结构来描述类别关系,在现实生活中人们实际的描述方式也是如此。鉴于此,提出了一种直接基于图的层次多标记分类方法,称为GraphHMLTC。该方法利用有向无圈图的拓扑排序而非树的自顶向下的层次关系来确定类别之间的分类顺序,并且该拓扑序根据分类情形进行动态维护。实验表明,采用层次图分类的GraphHMLTC方法比非层次分类方法的代表之一BoosTexter.MH在较大程度上改善了分类精度。该工作体现了基于层  相似文献   

8.
数据挖掘技术在个人信用评估模型中的应用   总被引:4,自引:0,他引:4  
为了能够及时、恰当地进行个人信用评估分析,加快信用卡发卡机构的决策速度,介绍了数据挖掘技术在信用卡公司对用户评估中的应用,对比分析了数理统计模型、分类-聚类个人信用评估模型等几种个人信用评估模型建模方法的优缺点。建立了一种决策树-神经网络个人信用评估模型,针对该模型提出了一种近邻聚类算法。该算法不需要事先给定聚类的类别数,可以进行无监督学习。通过对比分析可知,该算法在个人信用评估应用中可以得到较理想的结果。  相似文献   

9.
针对文本分类中传统特征选择方法卡方统计量和信息增益的不足进行了分析,得出文本分类中的特征选择关键在于选择出集中分布于某类文档并在该类文档中均匀分布且频繁出现的特征词。因此,综合考虑特征词的文档频、词频以及特征词的类间集中度、类内分散度,提出一种基于类内类间文档频和词频统计的特征选择评估函数,并利用该特征选择评估函数在训练集每个类别中选取一定比例的特征词组成该类别的特征词库,而训练集的特征词库则为各类别特征词库的并集。通过基于SVM的中文文本分类实验表明,该方法与传统的卡方统计量和信息增益相比,在一定程度上提高了文本分类的效果。  相似文献   

10.
数据挖掘技术在个人信用评估模型中的应用   总被引:1,自引:1,他引:1  
为了能够及时、恰当地进行个人信用评估分析,加快信用卡发卡机构的决策速度,介绍了数据挖掘技术在信用卡公司对用户评估中的应用,对比分析了数理统计模型、分类-聚类个人信用评估模型等几种个人信用评估模型建模方法的优缺点。建立了一种决策树-神经网络个人信用评估模型,针对该模型提出了一种近邻聚类算法。该算法不需要事先给定聚类的类别数,可以进行无监督学习。通过对比分析可知,该算法在个人信用评估应用中可以得到较理想的结果。  相似文献   

11.
AUC(ROC曲线下面积)评价标准已经广泛地用于度量机器学习中各种分类算法在两类数据集上的分类性能。首先介绍了SVM(支持向量机)多类分类方法,然后对AUC方法进行了系统地介绍,最后通过实验来比较各种SVM多类分类方法在多类别数据集上的AUC的值。实验结果表明,AUC值和核函数和多类转换方法的选取都有着密切的联系。  相似文献   

12.
向伟  王新维 《计算机科学》2020,47(5):103-109
不平衡数据分类是一种重要的数据分类问题。对于不平衡数据中规模较小的类,传统的分类算法的分类效果较差。对此,提出一种多类邻域三支决策模型的不平衡数据分类算法。首先,将传统的三支决策在混合数据和多个类的情形下进行推广,提出了混合数据的多类邻域三支决策模型;然后,在该模型中给出一种自适应代价函数的设定方法,并基于该方法提出了多类邻域三支决策模型的不平衡数据分类算法。仿真实验的结果表明,所提出的分类算法对于不平衡数据具有更好的分类性能。  相似文献   

13.
基于遗传算法和支持向量机的玉米品种识别   总被引:5,自引:0,他引:5  
提出了一种基于遗传算法(GA)和支持向量机(SVM)的玉米种子的图像特征选择和分类识别的新方法。该方法首先用遗传算法对采集到的玉米种子图像的特征进行优化,而后采用决策二叉树的支持向量机分类算法对玉米品种进行识别。该分类算法将分类器分布在各个结点上,构成多类支持向量机,减少了分类器的数量和重复训练样本的数量。实验结果表明该方法能选出适合于识别的玉米种子特征并能对玉米种子进行正确地识别。  相似文献   

14.
一种设计层次支持向量机多类分类器的新方法   总被引:15,自引:2,他引:13  
层次结构的设计是层次支持向量机多类分类方法应用中的关键问题,类间可分性是设计层次结构的重要依据,提出了一种基于线性支持向量机度量类间相似程度的方法,并给出了一种基于类间可分性设计层次支持向量机多类分类器的新方法。实验表明,新方法有效地提高了层次支持向量机多类分类器的分类精度和速度。  相似文献   

15.
研究一种应用小波特征向量和多类支持向量机进行病态语音识别的方法,该方法基于连续小波变换提取语音特征向量,利用多类支持向量机进行病态语音分类。为了简化二分类支持向量机进行多类分类时所带来的计算复杂性,根据一类支持向量机分类思想提出一种多类分类算法。该算法能够使每一类样本都独立地获得一个决策函数,通过决策函数的最大值来判断样本所属的类。实验表明,在病态语音识别系统中,多类支持向量机与小波特征向量相结合具有良好的识别效果和应用价值。  相似文献   

16.
提出了一种基于小波变换和多类支持向量机的图像分类新方法,该方法利用小波变换进行图像特征提取,利用多类支持向量机进行图像分类,并与基于图像底层特征的图像分类方法进行了实验比较。实验结果表明该方法具有较好的分类性能。  相似文献   

17.
基于结构风险最小化原则的支持向量机(SVM)对小样本决策具有较好的学习推广性。但由于常规SVM算法是从2类分类问题推导出的,在解决故障诊断这种典型的多类分类问题时存在因雄,因而提出一种依赖故障优先级的基于SVM的二叉树多级分类器实现(2PTMC)方法,该方法具有简单、直观,重复训练样本少的优点。通过将其应用于柴油机振动信号的故障诊断,获得了令人满意的效果。  相似文献   

18.
一种新的模糊补偿多类支持向量机   总被引:1,自引:1,他引:0  
张永  迟忠先  闫德勤 《计算机科学》2006,33(12):152-155
支持向量机是Vapnik等学者在统计学习理论的基础上提出的一种新的机器学习方法。针对支持向量机理论中的多类分类问题和对于噪音数据的敏感性,本文提出了一种模糊补偿多类支持向量机算法FC-SVM。该算法是在Weston等人提出的多类SVM分类器的直接构造方法中引入模糊补偿函数,针对每个输入数据对分类结果的两方面影响,将目标函数中的惩罚项不仅进行了模糊化,而且对于分类情况进行了加权补偿,并重构了优化问题及其约束条件,然后重构了Lagrange公式,给出了理论推导。在充分的数值实验基础上,将文中提出的方法应用于建设银行个人房贷的信用评估系统中,得到了较好的实验结果。  相似文献   

19.
提出一种新的基于快速序列视觉呈现(Rapid Serial Visual Presentation,RSVP)与稳态视觉诱发电位(Steady-State Visually Evoked Potential,SSVEP)组合范式的脑电信号(Electroencephalogram,EEG)刺激与多类事件检测方法。对诱发的原始脑电信号通过电位重参考、基线去除、空间滤波等预处理操作去除数据的伪迹和噪声,通过自举聚合决策树(Bagging Tree,BT)和支持向量机(Supported Vector Machine,SVM)等机器学习算法,对14名受试者双重刺激诱发的脑电信号进行目标与频率相结合的多类事件检测,通过实验验证了该组合范式诱发的脑电信号具有良好的多类可分性,为开发基于RSVP和SSVEP两种范式的混合型脑-机接口应用提供了一种新的有效途径。同时,实验结果还表明,基于机器学习的BT和SVM模型对RSVP和SSVEP组合范式诱发的EEG信号进行多类识别的性能明显优于传统的典型关联分析(Canonical Correlation Analysis,CCA)算法的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号