首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对交互式网络电视(IPTV)用户报障因素复杂、故障样本相对贫瘠的问题,基于相关向量机(RVM)高稀疏性的建模特点提出一种结合RVM参数优化和混合采样的IPTV用户报障预测方法(LFOA-HSRVM)。该方法将IPTV的用户报障预测视为一个针对非均衡数据集的二分类问题,克服了传统RVM算法在处理非均衡数据时决策边界偏向少数类样本的问题。实验表明,与其他相关算法相比,该算法的少数类分类性能和总体分类性能均有较大提升,能获得更好的报障预测效果。  相似文献   

2.
针对支持向量机对噪声的敏感,以及当两类训练样本数量差别悬殊时,造成分类结果倾向较大类等弱点,通过理论分析,合理地设计隶属度函数,提出了一种新隶属度函数的模糊支持向量机。该方法既可补偿倾向性造成的不利影响,又可增加抗噪声能力,提高预测分类精度。最后通过对含噪声的非均衡数据实验表明,该方法比传统支持向量机和简单去噪模糊支持向量机都有着较高的分类能力。  相似文献   

3.
陈青  薛惠锋  杜喆 《计算机仿真》2011,28(3):219-221,329
针对传统的最小二乘支持向量机对于非均衡数据的分类时,分类结果具有对较大类数据的偏向性问题,为了减小分类器的负担和样本的错误率.提出一种新的最小二乘支持向量机阈值计算方法进行修正.根据线性判别思想,计算出两类样本的在分类超平面法向量上的投影点的均值和方差,依据对两类样本错分概率相等准则,给出新的阈值计算方法从而实现对超平...  相似文献   

4.
非均衡数据的支持向量机新方法*   总被引:1,自引:0,他引:1  
为了弥补支持向量机对非均衡样本集分类时倾向于较大类的不足,提出一种平衡策略。基于Fisher判别思想,计算出两类样本在分类超平面法向量上投影后的均值和方差,再依据两类错分概率相等准则,给出新的阈值计算方法对超平面进行调整。该方法可补偿非平衡数据分类的倾向性,提高预测分类精度。最后在非均衡的人工和真实数据集上的数值实验表明了该方法的可行性与有效性。  相似文献   

5.
支持向量机是最有效的分类技术之一,具有很高的分类精度和良好的泛化能力,但其应用于大型数据集时的训练过程还是非常复杂。对此提出了一种基于单类支持向量机的分类方法。采用随机选择算法来约简训练集,以达到提高训练速度的目的;同时,通过恢复超球体交集中样本在原始数据中的邻域来保证支持向量机的分类精度。实验证明,该方法能在较大程度上减小计算复杂度,从而提高大型数据集中的训练速度。  相似文献   

6.
约简数据集的支持向量分类机算法   总被引:1,自引:0,他引:1  
支持向量机是当前智能计算研究领域的热点之一。基于支持向量机的大样本学习一直是一个非常具有挑战性的研究课题。对于分类问题给出一种基于相似度的约简数据集的方法。给出的新算法大大地减少了训练样本的数目和所求解的支持向量机算法的规模,有效地加快了支持向量机算法的训练速度。仿真实验表明:新算法较为简单、实用。  相似文献   

7.
大规模数据集下支持向量机训练样本的缩减策略   总被引:3,自引:0,他引:3  
大量数据下支持向量机的训练算法是SVM研究的一个重要方向和焦点。该文从分析SVM训练问题的实质和难点出发,提出一种在训练前先求出类别质心,去除非支持向量对应的样本,从而达到缩小样本集的方法。该方法在不损失分类正确率的情况下具有更快的收敛速度,并从空间几何上解释了支持向量机的原理。仿真实验证明了该方法的可行性和有效性。  相似文献   

8.
支持向量回归机使用由经验误差项和常数项所构成的风险函数,满足结构风险最小原则。在时态数据预测领域,它将成为一种很有前途的预测方法。简要介绍了回归支持向量机的基本理论。基于回归支持向量机模型,建立了一个对时态数据预测的方法,可以对多属性时态数据进行预测,并与其它预测模型(BP神经网络)进行比较。实验结果表明所提出的方法在预测的稳定性和准确性方面都要优于BP神经网络模型。  相似文献   

9.
基于样本投影分布的平衡不平衡数据集分类*   总被引:2,自引:0,他引:2  
提出一种平衡不平衡数据集统一分类方法,首先得到训练样本基于支持向量机(SVM)超平面法线方向上的投影;再借助支持向量数据描述(SVDD)对训练样本投影分布进行描述;测试样本在此基础上实现分类。平衡或不平衡数据集都可采用相同的方法进行分类。实验表明该方法能够同时对平衡或不平衡数据集进行有效的分类。  相似文献   

10.
针对不平衡数据集分类结果偏向多数类的问题,重采样技术是解决此问题的有效方法之一。而传统过采样算法易合成无效样本,欠采样方法易剔除重要样本信息。基于此提出一种基于SVM的不平衡数据过采样方法SVMOM(Oversampling Method Based on SVM)。SVMOM通过迭代合成样本。在迭代过程中,通过SVM得到分类超平面;根据每个少数类样本到分类超平面的距离赋予样本距离权重;同时考虑少数类样本的类内平衡,根据样本的分布计算样本的密度,赋予样本密度权重;依据样本的距离权重和密度权重计算每个少数类样本的选择权重,根据样本的选择权重选择样本运用SMOTE合成新样本,达到平衡数据集的目的。实验结果表明,提出的算法在一定程度上解决了分类结果偏向多数类的问题,验证了算法的有效性。  相似文献   

11.
《计算机科学与探索》2017,(10):1662-1671
随机梯度下降(stochastic gradient descent,SGD)方法已被应用于大规模支持向量机(support vector machine,SVM)训练,其在训练时采取随机选点的方式,对于非均衡分类问题,导致多数类点被抽取到的概率要远远大于少数类点,造成了计算上的不平衡。为了处理大规模非均衡数据分类问题,提出了加权随机梯度下降的SVM在线算法,对于多数类中的样例被赋予较小的权值,而少数类中的样例被赋予较大的权值,然后利用加权随机梯度下降算法对SVM原问题进行求解,减少了超平面向少数类的偏移,较好地解决了大规模学习中非均衡数据的分类问题。  相似文献   

12.
案件案由是对案件所涉及法律关系性质的描述,科学、完善的案由设置有利于正确适用法律,是人民法院实行案件分类管理的重要途径.案件案由预测技术指基于案件案情的文本描述由计算机自动给出案件所属类别.在案件属性预测研究中,由于低频类别的样本数量较少且难以学习相关特征,因此已有方法在数据处理部分通常会对低频类别样本进行剔除.然而,在案件案由预测问题中,关键的挑战正是如何对属于低频案由的案件做出准确预测.为此,文中提出了一种基于非均衡数据层次学习的案件案由预测方法.在案件案由预测中,根据案由层次结构将案由划分为一级案由和二级案由,二级案由中的大量尾部类别被汇聚成上层样本数较多的大类,进而通过层次学习的方式来实现二级案由的预测,使二级案由有一级案由的信息支撑.最后,引入调整数据不平衡的损失函数来实现案件案由的预测.实验结果表明,所提方法整体优于对比方法,其平均精确率比现有方法提高了4.81%,这表明通过层次学习和引入非均衡数据损失函数能较好地解决案件案由预测问题.  相似文献   

13.
少数类样本合成过采样技术(SMOTE)是一种典型的过采样数据预处理方法,它能够有效平衡非均衡数据,但会带来噪音等问题,影响分类精度。为解决此问题,借助主动学习支持向量机的分类性能,提出一种基于主动学习SMOTE的非均衡数据分类方法 ALSMOTE。由于主动学习支持向量机采用基于距离的主动选择最佳样本的学习策略,因此能够主动选择非均衡数据中的有价值的多数类样本,舍弃价值较小的样本,从而提高运算效率,改进SMOTE带来的问题。首先运用SMOTE方法均衡小部分样本,得到初始分类器;然后利用主动学习策略调整分类器精度。实验结果表明,该方法有效提高了非均衡数据的分类准确率。  相似文献   

14.
利用粒子群算法缩减大规模数据集SVM训练样本   总被引:2,自引:0,他引:2  
对于大规模SVM训练样本数据,在分类前采用粒子群算法进行样本缩减,每一个粒子的维对应一个样本状态,通过更新粒子的速度和位置信息,调整训练样本的状态,引导粒子向分类最优的样本状态组合方向移动,去除样本中对分类不起作用的非支持向量和冗余的支持向量所对应的样本,生成新的缩减样本,进行分类训练,从而达到提高训练效率的目的.基于大规模遥感图像数据集的分类实验表明,此方法在确保不降低分类精度的前提下减少了分类时间.  相似文献   

15.
基于加权近似支持向量机的文本分类研究   总被引:1,自引:1,他引:1  
文本分类能够很好地帮助用户整理、获取信息,在提高信息检索的速度和准确率方面显得意义重大,具有很重要的研究价值.针对以往的近似支持向量机没有考虑不均衡数据的情况,提出了通过对每个训练错误赋予一个权值来改进近似支持向量机,并给出了一种简单的参数估计方法.实验结果表明,基于加权近似支持向量机的分类算法在处理不均衡数据时,样本数少的类别分类精度得到提高,性能表现良好.  相似文献   

16.
针对高校学生就业去向预测这一问题无法快速获取精准预测结果的缺陷,提出了机器学习算法的高校学生就业去向预测方法.采集身份信息、专业成绩等高校学生就业去向预测相关数据,将所采集数据通过数据清洗、数据规约以及处理缺失值、异常值3部分完成数据预处理,利用特征选择算法依据完成预处理的数据获取最优特征子集,利用最优特征子集建立高校...  相似文献   

17.
多传感器的多源异构数据融合处理时,大量的冗余数据及复杂的非线性可分空间导致能耗较大,为此,提出了BP神经网络和支持向量机的多源异构数据融合算法。以数据关系构建约束条件,利用BP神经网络算法建立数据清洗模型,判定节点变量的活跃程度,优化数据输入;建立数据集合,提取数据特征向量;利用支持向量机泛化能力强、凸优化的特点,获取特征的最优分类超平面,获得非线性可分多源数据集转化为高维线性可分空间的最优决策值,输出结果。实验结果表明,该算法融合多源异构数据的能量消耗小、延迟低,融合效果好。  相似文献   

18.
张岩  闫德勤  郑宏亮 《计算机应用》2011,31(10):2786-2789
针对传统支持向量机(SVM)对噪声点过于敏感,模糊支持向量机(FSVM)又对样本集几何形状过分依赖等问题,提出基于噪声过滤系统的粗糙支持向量机(NFS-RSVM)。该方法首先用噪声过滤系统(NFS)将极可能为噪声点的样本过滤掉;然后将数据间隐含的等价类信息作为双惩戒因子融入到支持向量机模型中,进一步区分有效样本和噪声样本。基于UCI数据集的仿真结果表明,NFS-RSVM方法能有效地将数据中的大部分噪声点去除,与传统的SVM和FSVM相比分类精度有一定程度的提高。因此,该方法在处理噪声样本较多又呈现非球形分布的数据集时,表现出较好的抗噪性、分类效果和泛化能力。  相似文献   

19.
不平衡数据集问题从20年前就已经引起人们的重视, 提出的相关解决方法层出不穷. Mixup是这几年比较流行的数据合成方法, 其相关变体比比皆是, 但是针对不平衡数据集提出的Mixup变体寥寥无几. 本文针对不平衡数据集分类问题, 提出了Mixup的变体——Borderline-mixup, 其使用支持向量机选择边界样本, 增加边界样本在采样器中被采样的概率, 构建两个边界采样器, 替代了原有的随机采样器. 在14个UCI数据集以及CIFAR10长尾数据集上的实验结果表明, Borderline-mixup相比于Mixup在UCI数据集中都有提升, 最高能达到49.3%的提升, 在CIFAR10长尾数据集中, 也能达到3%–3.6%左右的提升. 显然, 我们提出的Mixup变体在不平衡数据集分类中是有效的.  相似文献   

20.
判别式分类器通过生成不同复杂度的指示函数去调节算法与所解决问题的适应性,能有效地避免过拟合现象。分类器融合方法就是应用单个分类器对特定样本预报的特异性来提高模型的整体预测精度,应用支持向量机(SVM)对乳腺癌数据进行建模,通过选取不同的模型参数(径向基核函数参数gamma和正则化约束参数cost)构建9个单分类器,通过投票策略在单分类器上构建融合分类器,融合模型对乳腺癌数据的预测精度为98.59%,相比单分类模型对此数据集的预测精度97.72%有明显的竞争力,试验结果表明融合模型能有效提升分类器的泛化能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号