首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 375 毫秒
1.
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出基于近邻密度改进的SVM(NDSVM)不平衡数据集分类算法.该算法先计算多数类内每个样本的近邻密度值,然后依据该密度值选出多数类中位于边界区域、靠近边界区域的与少数类数目相等的样本分别与少数类完成SVM初始分类,最后用所得的支持向量机和剩余的多数类样本完成初始分类器迭代优化.人工数据集和UCI数据集的实验结果表明,与WSVM、ALSMOTE -SVM和基本SVM算法相比,本文算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能.  相似文献   

2.
对于平衡数据集支持向量机(support vector machine,SVM)通常具有很好的分类性能和泛化能力,然而对于不平衡数据集,SVM只能得到次优结果,针对该问题提出了一种基于SVM的AS-Ada Boost SVM分类算法.首先,通过使用ADASYN采样,提高少类样本在边界区域的密度;然后,使用基于径向基核支持向量机(radial basis function kernel mapping support vector machine,RBFSVM)模型弱分类器的Ada Boost SVM算法训练得到决策分类器.通过将该算法在各种不平衡数据集上的测试结果与单纯运用ADASYN技术、Ada Boost SVM、SMOTEBoost等其他分类器进行比较,验证了该算法的有效性和鲁棒性.  相似文献   

3.
针对传统SVM算法在失衡数据集下的分类性能不理想的问题,提出一种基于核聚类集成SVM算法.该算法首先在核空间中对多数类样本集进行聚类,然后随机选择出具有代表意义的聚类信息点,实现在减少多数类样本数的同时将分类界面向多数类样本方向偏移.并利用AdaBoost集成手段对基于核聚类的欠取样SVM算法进行集成,最终提高SVM算法在失衡数据下的泛化性能.将提出的算法同其他失衡数据预处理集成方法进行比较,实验结果表明该算法能够有效提高SVM算法在失衡数据中少数类的分类性能,且总体分类性能及运行效率都有明显提高.  相似文献   

4.
针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些界分别扩展到正例和反例.在此基础上,证明了正例的支持向量率和边界支持向量率分别依概率大于反例的支持向量率和边界支持向量率,以及正例的分类性能依概率差于反例的分类性能.针对German credit和Heart disease两个Benchmark数据集的试验研究,验证了本文假设的合理性和上述结论的正确性.  相似文献   

5.
改进的球结构SVM多分类增量学习算法   总被引:1,自引:0,他引:1  
针对球结构支持向量机(support vector machine,SVM)增量学习算法在训练时间和分类精度上的不足,提出了一种改进的球结构SVM多分类增量学习算法.该算法首先构造一个完全二叉树用于多类分类;分析新增样本的加入对原支持向量集的影响,将新增样本集中部分样本和原始训练集中的支持向量以及分布在球体一定范围内的样本合并做为新的训练集,完成分类器的重构.实现通过减少训练样本缩短训练时间和完善分类器提高分类精度的目的.通过UCI标准数据集实验,结果表明,该算法在所需训练的样本数、训练时间以及准确率3方面都优于球结构SVM增量学习算法,尤其当样本分布不平衡时,该算法有更高的分类准确率.  相似文献   

6.
针对模糊c-harmonic均值算法(FCHM)在不平衡数据集上的聚类效果不理想的问题,提出了一种基于聚类体量约束的模糊c-harmonic均值算法。首先,利用隶属度矩阵定义各个类的体量,用于约束FCHM算法的代价函数,从而构建一个新的代价函数;然后,将该代价函数最小化,得到新的隶属度矩阵和聚类中心的计算公式;最后,在UCI数据集、模拟不平衡数据集及真实机床振动检测不平衡数据集上分别进行实验。实验结果表明,与同类算法相比,本文算法在保持传统算法全局最优性能的同时,在不平衡数据集上也能得到理想的聚类效果。  相似文献   

7.
粗支持向量机分类建模方法   总被引:2,自引:0,他引:2  
为了克服样本模式的复杂性、噪声的影响以及信息的不完整性问题,利用粗糙集和支持向量机(SVM)的优点,把粗糙集理论用于二分类球形SVM,提出一种称为粗支持向量机分类建模方法.粗糙集具有刻画不确定、不完整数据和复杂模式的能力,分类结果能够体现出数据的不确定性,但是它不仅不具备良好的学习能力,而且也不能保证分类模型具有良好的推广能力;SVM具有良好的推广性能,但是对不确定数据的建模能力较差.本文把分类结果分为正域、边界域和负域,由此来判断不确定数据样本的分类结果的不确定性程度.通过调整参数来调节边界的宽度和允许建模的在野点样本的比例,提高分类模型的灵活性.仿真结果说明了算法的有效性.  相似文献   

8.
&#  &#  &#  &#  &# 《西华大学学报(自然科学版)》2015,34(5):16-23, 74
针对不均衡数据下分类超平面偏移、少数类识别率较低的问题,提出一种基于样本密度的不均衡数据分类算法。该算法首先计算样本密度和类样本密度,依据类样本密度之间的关系确定聚类类数, 然后利用K-means聚类算法对多数类样本进行聚类,用聚类所得类中心作为样本集取代原多数类样本集, 最后对新构造的训练集进行训练得到最终决策函数。其实验结果表明,该算法能够提高SVM在不均衡数据下的分类性能,尤其是少数类的分类性能。    相似文献   

9.
基于支持向量机(SVM)的卷积神经网络(CNN)模型结合了大间隔原理,在图像识别中表现出了优异的泛化性能。然而,该方法忽视了一个关键:SVM的泛化性能不仅取决于不同类之间的间隔,还与所有样本的最小包含球(MEB)的半径有关。针对这一事实,文章提出一种基于半径间隔界(RMB)驱动的CNN模型的图像特征提取和识别的方法。与传统CNN模型相比,该模型采用基于SVM泛化误差界的策略来指导CNN深度模型学习和相应分类器构建,不仅考虑了不同类别之间的间隔,还考虑了MEB的半径。该模型能提高深度卷积模型的泛化能力而不会额外增加网络的复杂度,还能够应用于不同的深度模型中而不受限于某一特定的网络结构。在多个数据集上的实验结果表明,相比于基于Sofmax损失的CNN模型、基于中心损失的CNN模型以及基于 SVM 的 CNN 模型,该模型能够提取到鉴别性更强的图像特征,取得更高的识别率。  相似文献   

10.
针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于ν-SVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些界分别扩展到正例和反例.在此基础上,证明了正例的支持向量率和边界支持向量率分别依概率大于反例的支持向量率和边界支持向量率,以及正例的分类性能依概率差于反例的分类性能.针对German credit和Heart disease两个Benchmark数据集的试验研究,验证了本文假设的合理性和上述结论的正确性.  相似文献   

11.
为了了解同一断层检测模型在不同插值方法下的检测效果和同一插值方法在不同断层检测模型的检测效果.对比视觉几何组VGG(Visual Geometry Group)、多层感知机MLP(Multi--layper Perceptron)、支持向量机SVM(Support Vector Machine)三种断层检测模型在lin...  相似文献   

12.
单类支撑向量机(One-Class SVM)是一种重要的核方法,但是其缺少对数据分布信息的考虑,因而制约了其泛化能力的进一步提高。针对此问题,重新定义了原点到超平面的距离,进而提出了基于数据分布信息的单类支撑向量机(DD One-Class SVM)。推导构建了DD One-Class SVM算法的优化问题,详细分析和讨论了该优化问题在散度矩阵奇异情况下的求解方法以及该算法的非线情况。相对于传统One-Class SVM算法,该算法体现出了更好的泛化能力。  相似文献   

13.
LS_ SVM和SVM在发酵过程建模中的比较   总被引:1,自引:1,他引:0  
针对最小二乘支持向量机(LS_ SVM)不需要指定逼近精度ε的特点,比较了LS_ SVM与SVM两种方法利用生产数据为青霉素发酵过程建立的数学模型,改进型GA分别为LS_ SVM和SVM选择参数值.实验证明:LS_ SVM建立的模型具有较高的拟合精度和泛化能力.如果ε过大时,SVM建立的模型的拟合精度和泛化能力不高;当ε过小时,模型的拟合精度和泛化能力较高,但耗时多.因此,LS_SVM更适合为发酵过程建模.  相似文献   

14.
双支持向量机是近年提出的一种新的支持向量机。在处理模式分类问题时,双支持向量机速度远远超过传统支持向量机,而且显示出较好的推广能力。但双支持向量机没有考虑不同输入样本点可能会对分类超平面的形成产生不同影响,在某些实际问题中具有局限性。为了克服这个缺点,提出了一种基于模糊隶属度的双支持向量机。该算法设计了一种基于距离的模糊隶属度函数,给不同的训练样本赋予不同的模糊隶属度,构建两个最优非平行超平面,最终实现二值分类。实验结果表明,这种改进双支持向量机的分类性能优于传统的双支持向量机。  相似文献   

15.
基于支持向量机的理论提出了一种用于图像检索的半监督学习算法。该算法的基本思想是,如果两点彼此是最近点,则它们共用一个标注。因此,该算法可以在具有最大类间空隙和很好保留位置特征的基础上找到一个投影。对该算法和标准支持向量机及转导(transductive)支持向量机的图像检索效果进行了实验比较,结果表明该算法可以获得更好的效果。  相似文献   

16.
单类支撑向量机(One—Class SVM)是一种重要的核方法,但是其缺少对数据分布信息的考虑,因而制约了其泛化能力的进一步提高。针对此问题,重新定义了原点到超平面的距离,进而提出了基于数据分布信息的单类支撑向量机(DDOne—Class SVM)。推导构建了DDOne—Class SVM算法的优化问题,详细分析和讨论了该优化问题在散度矩阵奇异情况下的求解方法以及该算法的非线情况。相对于传统One.Class SVM算法,该算法体现出了更好的泛化能力。  相似文献   

17.
The paper proposes a new fuzzy SVM, called CI-FSVM(Class Imbalance Fuzzy Support Vector Machine) short for which is based on imbalanced datasets classification. By improving penalty functions, we reduce the sensitivity of the model for imbalanced datasets with “overlap”. In addition, the parameters in SVM models are optimized by the grid-parameter-search algorithm. The results show that the CI-FSVM has a better effect in imbalanced datasets classification compared with other models. It not only has a higher overall accuracy, but also improves are judgment accuracy when dealing with the minority classifications.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号