共查询到17条相似文献,搜索用时 156 毫秒
1.
2.
为了提高模糊支持向量机在大数据集上的训练效率,提出一种基于两阶段聚类的模糊支持向量机算法。第1阶段为粗粒度聚类阶段,在每类训练样本上执行密度聚类算法,设置较大的邻域半径(给定邻域内最小点数),保证可能成为支持向量的样本点都被选取;第2阶段为自适应聚类阶段,在粗选的数据集合上,执行自适应密度聚类算法,根据各个点距离分类面的远近,自适应决定该点的邻域半径(给定邻域内最小点数)。这样可有效地减少远离分类面的聚类边缘点的数量,同时在分类面附近保持较多的样本点,试验结果表明,基于两阶段聚类模糊支持向量机算法,相比以往的方法,不仅提高了模糊支持向量机的训练效率,同时保持了较好的分类效果。 相似文献
3.
4.
5.
6.
基于类中心设计隶属度函数的模糊支持向量机能有效地解决支持向量机对噪声或孤立点敏感度高的问题,但是,由于它对支持向量赋予较小的隶属度,从而降低了其分类作用。基于此,提出一种新的隶属度函数设计方法;同时,针对模糊支持向量机普遍存在因核函数计算量大,而导致训练时间长的问题,通过使用一种高效的截集模糊C-均值聚类方法对训练样本进行聚类,然后以聚类中心作为样本进行训练,以减少训练样本来提高训练速度。根据上述新的隶属度函数设计方法和截集模糊C-均值聚类方法,构建了一种基于截集模糊C-均值聚类并改进了隶属度函数的模糊支持向量机,数值试验表明这种新的模糊支持向量机有效地提高了训练速度和分类精度。 相似文献
7.
基于模糊划分和支持向量机的TSK模糊系统 总被引:2,自引:0,他引:2
为了提高模糊系统处理高维问题的推广能力与鲁棒性能,提出将模糊聚类和支持向量机算法结合起来构造TSK模糊系统的算法.首先运用模糊聚类算法对输入空间进行划分,确定模糊规则前件的隶属函数.然后用支持向量机算法确定模糊规则的后件参数.该支持向量机的核函数是由模糊规则前件的隶属函数构造的,并且是Mercer核.在3个数据集的实验结果表明,与TSK模糊系统的传统算法和支持向量机相比较,本文算法具有更好的推广能力和鲁棒性. 相似文献
8.
9.
针对传统支持向量机(SVM)对噪声点过于敏感,模糊支持向量机(FSVM)又对样本集几何形状过分依赖等问题,提出基于噪声过滤系统的粗糙支持向量机(NFS-RSVM)。该方法首先用噪声过滤系统(NFS)将极可能为噪声点的样本过滤掉;然后将数据间隐含的等价类信息作为双惩戒因子融入到支持向量机模型中,进一步区分有效样本和噪声样本。基于UCI数据集的仿真结果表明,NFS-RSVM方法能有效地将数据中的大部分噪声点去除,与传统的SVM和FSVM相比分类精度有一定程度的提高。因此,该方法在处理噪声样本较多又呈现非球形分布的数据集时,表现出较好的抗噪性、分类效果和泛化能力。 相似文献
10.
一种新的支持向量机大规模训练样本集缩减策略 总被引:2,自引:0,他引:2
支持向量机(SVM)在许多实际应用中由于训练样本集规模较大且具有类内混杂孤立点数据,引发了学习速度慢、存储需求量大、泛化能力降低等问题,成为直接使用该技术的瓶颈。针对这些问题,通过在点集理论的基础上分析训练样本集的结构,提出了一种新的支持向量机大规模训练样本集缩减策略。该策略运用模糊聚类方法快速的提取出潜在支持向量并去除类内非边界孤立点,在减小训练样本集规模的同时,能够有效地避免孤立点数据所造成的过学习现象,提高了SVM的泛化性能,在保证不降低分类精度的前提下提高训练速度。 相似文献
11.
模糊支持向量机隶属度的确定方法 总被引:2,自引:0,他引:2
传统的支持向量机对噪声或野点是敏感的,针对这种情况,引入了模糊支持向量机,但模糊隶属度的确定是个难点。利用基于线性规划下的一类分类算法来确定模糊隶属度,根据不同输入样本对分类的贡献不同,赋予相应的隶属度,将噪声或野点与有效样本区分开。实验结果表明,模糊支持向量机比传统的支持向量机有更好的分类效果,能够削弱噪声或野点的影响。 相似文献
12.
支持向量机算法对噪声和异常点是敏感的,为了克服这个问题,人们引入了模糊隶属度。传统确定样本模糊隶属度的方法,都是基于原始空间的。文章提出了基于特征空间的模糊隶属度函数模型。在该模型中,以特征空间中的样本为中心,以给定的距离d为半径作超球,根据其它样本落到超球内的个数来确定中心样本点的模糊隶属度。并将新的模糊隶属度模型引入自适应支持向量机,提出了模糊自适应支持向量机算法。实验结果表明,该模型能有效地提高自适应支持向量机的抗噪能力和预测精度。 相似文献
13.
基于类中心思想的去边缘模糊支持向量机 总被引:6,自引:1,他引:6
针对两类分类问题中样本点数量多、类别模糊且有孤立野点的情况,论文在类中心向量方法的基础上,提出了一种基于类中心思想的去边缘模糊支持向量机,该方法用类中心思想预先去掉那些可能不是支持向量的点,并采用降半哥西分布作为隶属度,使其适合模糊分类的性能特点。从理论和实证分析两个方面将该方法与线性可分SVM及模糊SVM进行了对比分析,结果显示该方法不但大大减少了训练点数目,从而减小了内存和计算量,提高了训练速度,而且减少了孤立野点对支持向量分类机的影响。 相似文献
14.
15.
针对支持向量机对噪声的敏感,以及当两类训练样本数量差别悬殊时,造成分类结果倾向较大类等弱点,通过理论分析,合理地设计隶属度函数,提出了一种新隶属度函数的模糊支持向量机。该方法既可补偿倾向性造成的不利影响,又可增加抗噪声能力,提高预测分类精度。最后通过对含噪声的非均衡数据实验表明,该方法比传统支持向量机和简单去噪模糊支持向量机都有着较高的分类能力。 相似文献
16.
由于SVM(Support Vector Machine)在有离群点和不平衡数据的问题中分类性能相对较低,有研究者提出了一种面向不均衡分类的隶属度加权模糊支持向量机,只是文中的模糊隶属度并不能较好衡量样本点对确定最佳分划超平面所做的贡献大小。针对以上问题提出了密度峰(Density Peaks,DP)聚类的可信性加权模糊支持向量机。首先由DP聚类找到离群点后剔除。再根据点到由DEC(Different Error Costs)确定的超平面的距离,得到初始隶属度,并用改进的FSVM-CIL(Fuzzy Support Vector Machines for Class Imbalance Learning)更新隶属度。之后剔除部分样本点,起到简约样本的作用,并减少数据不平衡带来的影响。通过实验验证了所提出算法的有效性。 相似文献
17.
高的计算复杂度限制了双边加权模糊支持向量机在实际分类问题中的应用。为了降低计算复杂度,提出了应用序贯最小优化算法(SMO)解该模型,该模型首先将整个二次规划问题分解成一系列规模为2的二次规划子问题,然后求解这些二次规划子问题。为了测试SMO算法的性能,在三个真实数据集和两个人工数据集上进行了数值实验。结果表明:与传统的内点算法相比,在不损失测试精度的情况下,SMO算法明显地降低了模型的计算复杂度,使其在实际中的应用成为可能。 相似文献