共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
提出了一种有效应用于失衡数据集的分类方法,其核心思想是从样本预处理和分类器改进两方面入手,为失衡数据集的分类问题提供全面的解决方案.首先创造性地采用动态自组织映射聚类的方法对失衡数据集进行重采样,这种采样方法,有效地解决了传统重采样的方法随机性强,人为主观干扰以及信息损失等弊端.随后借助K-近邻规则的思想,对新采集的样本进行剪枝,有效地解决了实际存在的数据混叠现象.算法对SVM的核函数进行等角变换,由此对类边界进行了校准,以适应样本类别失衡的情况.通过对三种算法的对比实验证明了算法在失衡数据集分类上的有效性.本文的算法已经在答案抽取技术中得到了成功应用,并在TREC2006国际QA 评测中得到了客观充分的验证. 相似文献
3.
本文将样本为独立同分布的情形减弱为一致遍历马氏链的情形去研究了非平衡数据分类算法的泛化性能,提出了基于马氏抽样的SVM非平衡数据分类算法、基于马氏抽样的EDSVM非平衡数据分类算法和基于马氏抽样的SVM-WKNN非平衡数据分类算法.并用UCI数据库中的10个实际不平衡数据集进行数值实验,实验结果表明基于马氏抽样的上述三种算法的错分率均比基于随机抽样的对应算法的错分率要低,且上述三种算法中,基于马氏抽样的SVM-WKNN非平衡数据分类算法的泛化性能最好. 相似文献
4.
针对不平衡数据分类问题,在数据层面对不平衡数据集进行预处理,即对多数类数据进行先聚类,后欠采样的方式,减少多数类数据的数目,降低数据集的不平衡度,之后再用KNN算法对其进行分类。实验结果表明,对数据层面的预处理,使少数类数据的分类效果得到了提升。 相似文献
5.
摔倒检测系统能够实时监测用户的运动状态,当用户摔倒时,自动发出警报,让用户得到及时的救治。对于摔倒检测方法的研究通常采用自建数据集进行验证实验,然而,数据集的差异影响实验结果的好坏,实验结果无法进行比较,影响实验结果的可信度。文章使用三个基于加速度数据的摔倒检测公开数据集,采用基于运动方向特征及支持向量机(SVM)的方法进行分类实验。分类算法在三个数据集上的实验结果为:Mobi Act数据集的灵敏度与特异性为97.41%和98.10%;t Fall数据集的灵敏度与特异性为96.55%和97.86%;Sis Fall数据集的灵敏度与特异性为98.77%和99.03%。 相似文献
6.
7.
一种改进的SVM支持向量分类方法 总被引:1,自引:0,他引:1
提出了一种改进的支持向量分类方法,根据支持向量机中支持向量不会出现在两类样本集间隔以外的正确划分区的理论,通过引入类质心距等概念,从而较好地解决了当两类样本集混淆严重的时候如何更加精确地进行剔除混淆点,保证算法泛化性的问题。实验表明,采用这种改进的算法在两类训练样本集混淆较严重时能较好地解决泛化性问题。 相似文献
8.
一种基于RVM回归的分类方法 总被引:3,自引:0,他引:3
支持向量机是用于分类与回归的技术.由于其自身的诸多缺点,如无法获得概率输出,需要估计一个误差参数C,以及必须使用Mercer核函数等.相关向量机算法,克服了SVM上述缺点,RVM能获得与SVM相比拟的推广性能,并且更为稀疏.在此基础上,文中介绍了一种RVM回归用于分类的新分类方法,用RVRC来表示.并通过实验证明了它的... 相似文献
9.
在当前的机器学习领域,如何利用支持向量机(SVM)对多类目标进行分类,同时提高分类器的分类效率已经成为研究的热点之一,有效地解决此问题对于提高目标的识别概率具有较大意义。本文针对SVM多分类问题提出了一种基于遗传算法的SVM最优决策树生成算法。算法以随机生成的决策树构建的SVM分类器对同一测试样本的分类正确率作为遗传算法的适应度函数,通过遗传算法寻找到最优决策树,再以最优决策树构建SVM分类器,最终实现SVM的多分类。将该算法应用于低空飞行声目标识别问题,实验结果表明,新方法比传统的1-a-1、1-a-r、SVM-DL和GADT-SVM方法有更高的分类精度和更短的分类时间。 相似文献
11.
提出了一种基于支持向量数据描述(SVDD)的数据约简方法,该方法利用一类学习算法SVDD的特性,通过迭代优化运算有效地实现了对原始训练样本数据的约简。实验数据的结果表明,该方法简单易行,具有稳定性和准确性,能大大缩减原始训练集规模的同时保持原分类问题的识别精度。 相似文献
12.
13.
为在不显著降低垃圾邮件识别精度的同时有效提高邮件识别速度,提出了一种在线垃圾邮件快速识别新方法.首先引入用户正、负兴趣集的概念,结合用户兴趣集及支持向量机对邮件进行分类;然后根据主动学习理论,结合训练集样本密度及改进角度差异方法寻找分类最不确定的样本并推荐给用户进行类别标注;最后将标注后样本及分类最确定性样本加入训练集,并使用样本价值评价新函数淘汰冗余样本以生成新的训练集.实验表明,本文方法的用户标注负担小,垃圾邮件识别精度高、速度快,具有较高的在线应用价值. 相似文献
15.
基于随机下采样和SMOTE的不均衡SVM分类算法 总被引:5,自引:0,他引:5
传统的支持向量机(SVM)算法在数据不均衡的情况下,分类效果很不理想。为了提高SVM算法在不均衡数据集下的分类性能,提出随机下采样与SMOTE算法结合的不均衡分类方法。该方法首先利用随机下采样对多数类样本进行采样,去除样本中大量重叠的冗余样本,使得在减少数据的同时保留更多有用信息;而对少数类样本则是利用SMOTE算法进行过采样。实验部分将其应用在UCI数据集中并同其他采样算法比较,结果表明文中算法不但能有效提高SVM算法在不均衡数据中少数类的分类性能,而且总体分类性能也有所提高。 相似文献
16.
17.
支持向量机(SVM)由于其出色的泛化能力,已成为目标检测领域应用最为广泛的分类器之一.然而在检测过程中,过多的支持向量会产生很大的时间开销,从而降低目标检测系统的实时性.针对此问题,提出一种约简支持向量的方法,以降低分类器的决策开销,加快检测速度.此方法采用迭代的方式来估计特征空间中向量的原像,通过构建精简原像集来简化支持向量机,从而达到了提升分类速度的效果.利用精简的SVM结合Selective Search+ BoW模型构建了一款快速检测器,测试结果表明:该检测器能够在保证检测率的前提下,通过约简支持向量,提高目标检测的实时性. 相似文献
18.
采用海岸线做为地标进行静止卫星导航是一种重要的遥感图像自动导航方法,此方法在静止卫星遥感图像中选取特定区域,检测其中的海陆分界线,与全球海岸线标准模板库的相应区域进行匹配,依据计算获得的偏移量调整卫星姿态.根据静止卫星图像自动导航过程的特点,本文提出了一种适用于红外通道的基于水平集算法的海陆分界线检测方法,本方法依据地标模板库进行初始化,采用一种可扩展区域能量泛函推动曲线进行演化,直至收敛.实验结果表明,本方法具有迭代次数少,稳定性好,精度高的特点. 相似文献