共查询到10条相似文献,搜索用时 15 毫秒
1.
2.
粗糙集理论和支持向量机在数据挖掘方面具有较强的互补特性,基于粗糙集理论的上近似集、下近似集和边界域概念,结合支持向量机的分类原理,提出了一种支持向量机分类算法。首先,在支持向量机分类中定义样本分类的粗糙集规则,然后在边界域寻找两类样本中使判别式绝对值取值最小且分类正确的样本来确定最优分类面,脱离了对惩罚系数C的寻优问题,有效避免了过拟合问题,并通过循环迭代算法寻找合适的参数b,获得分类性能更优的支持向量机,最后通过对一个二维样本数据库进行分类实验,验证了此算法的有效性与可行性。 相似文献
3.
针对标准支持向量机(SVM)识别非均衡数据往往会出现最优超平面倾向性和正类样本大量错分的现象,探讨SVM识别非均衡数据失效的原因及对策;考虑到SVM最优超平面仅由少量支持向量完全决定的特性,提出一种基于负类边界样本裁剪策略的SVM数学模型.鉴于该模型需经多次负类数据的"训练-裁剪"过程才能较好地识别正类样本且较为费时,以等效的一次性裁掉更多样本的裁截面技术作为替代,提出一种耦合负类样本裁剪与非对称错分惩罚的非均衡SVM算法,并利用改进正余弦优化算法优化裁剪偏移量以提高算法的非均衡数据处理能力.数值实验结果验证了裁剪偏移量的优化必要性、改进正余弦优化算法的较强优化性能和改进SVM算法对非均衡数据的较好识别性能. 相似文献
4.
基于K最近邻的支持向量机快速训练算法 总被引:2,自引:0,他引:2
传统支持向量机训练大规模样本时间和空间开销大,使其应用受到了很大限制。为了提高支持向量机的训练速度,根据支持向量机的基本原理,应用K最近邻思想来筛选训练样本集,提出了基于K最近邻的支持向量机快速训练算法(KNN-SVM)。算法首先选取一部分最有可能成为支持向量的样本——边界向量,然后用边界向量集代替训练样本集进行支持向量机训练,大幅度减少了训练样本的数量,使支持向量机的训练速度显著提高。同时,由于边界向量包含了支持向量,因此,支持向量机的分类能力没有受到影响。仿真实验结果表明,与传统支持向量机相比,在分类精度相同的情况下,算法能够有效地提高支持向量机的训练速度,而且还可以提高支持向量机的分类速度和推广能力。 相似文献
5.
为了提高传统支持向量域描述(C-SVDD)算法处理不均衡数据集的分类能力,提出一种基于密度敏感最大软间隔支持向量域描述(DSMSM-SVDD)算法.该算法通过对多数类样本引入相对密度来体现训练样本原始空间分布对求解最优分类界面的影响,通过在目标函数中增加最大软间隔正则项,使C-SVDD的分类边界向少数类偏移,进而提高算法分类性能.算法首先对每个多数类样本计算相对密度来反映样本的重要性,然后将训练样本输入到DSMSM-SVDD中实现数据分类.实验部分,讨论了算法参数间的关系及其对算法分类性能的影响,给出算法参数取值建议.最后通过与C-SVDD的对比实验,表明本文建议的算法在不均衡数据情况下的分类性能优于C-SVDD算法. 相似文献
6.
最小化类内距离和分类算法 总被引:1,自引:0,他引:1
支持向量机分类算法引入惩罚因子来调节过拟合和线性不可分时无解的问题,优点是可以通过调节参数取得最优解,但带来的问题是允许一部分样本错分。错分的样本在分类间隔之间失去了约束,导致两类交界处样本杂乱分布,并且增加了训练的负担。为了解决上述问题,该文根据大间隔分类思想,基于类内紧密类间松散的原则,提出一种新的分类算法,称之为最小化类内距离和(Intraclass-Distance-Sum-Minimization, IDSM)分类算法。该算法根据最小化类内距离和准则构造训练模型,通过解析法求解得到最佳的映射法则,进而利用该最佳映射法则对样本进行投影变换以达到类内间隔小类间间隔大的效果。相应地,为解决高维样本分类问题,进一步提出了该文算法的核化版本。在大量UCI数据集和Yale大学人脸数据库上的实验结果表明了该文算法的优越性。 相似文献
7.
最小二乘支持向量机的一种非均衡数据分类算法 总被引:2,自引:2,他引:0
为了提高支持向量机的非平衡数据分类能力,分析了最小二乘支持向量机的本质特征,提出了一种基于中心距离比的非平衡数据分类算法,同时通过修剪边界样本,解决了最小二乘支持向量机缺失稀疏性的问题.在UCI标准数据集上进行的试验表明:该算法能够有效地提高支持向量机对非均衡分布数据的正确性,且该算法在不影响训练精度的前提下,可以得到稀疏解,算法的训练速度也有了一定的提高. 相似文献
8.
以提升网络热门舆情分类准确率,降低分类时间为目标,提出了基于数据挖掘技术的网络热门舆情分类方法.将小波核函数和支持向量机结合构成小波模糊支持向量机,采用增量学习机制和贝叶斯分类算法建立增量贝叶斯分类算法,组成小波模糊支持向量机-增量贝叶斯分类算法解决测试样本易分类失误以及类条件独立假定性很难获取问题,通过计算待测样本和... 相似文献
9.
10.
为了在AdaBoost算法基础上进一步提高人脸检测率,提出首先运用AdaBoost算法对样本进行训练得到T个分类器,然后通过空间支持向量域分类(SSVDC)方法找到T个分类器的超球半径以及球心。同时,为了提高检测速度,首先对彩色图像进行肤色分割,去掉背景以及非肤色区域,然后计算所测样本的对应T个分类器的特征值,并计算其到各个超球球心的距离,并根据其与超球半径的关系来判断是否为人脸。在ORL人脸库、YALE人脸库以及CMU+MIT人脸库中进行实验。实验结果表明:本文算法比AdaBoost算法具有更高的检测速度与检测率,检测率可达到94.4%。 相似文献