首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 218 毫秒
1.
为了提高模糊支持向量机在大规模数据集上的训练效率,提出了一种基于聚类粒度的模糊支持向量机算法.首先在每类训练样本上执行无监督聚类算法,产生聚类颗粒.在综合考虑了聚类中心、半径和聚类中的样本数目等聚类信息基础上,找到每个聚类内部的边缘点和交叉点集合,去除对分类贡献很小的聚类内部点,最终形成了新的用于模糊支持向量机训练的样本集合.随后的试验结果表明,由聚类颗粒生成的约简样本集合,很好的表示了原有样本的分布,不仅提高了训练效率,同时保持了较好的分类效果.  相似文献   

2.
针对支持向量机训练样本冗余导致训练效率低下的问题,提出一种基于Fisher向量投影的支持向量机增量算法。该算法根据支持向量机中支持向量的分布特性对初始训练集及增量集进行预处理,减少训练样本个数;通过判断初始样本是否满足新增样本集的卡罗需-库恩-塔克(Karush-Kuhn-Tucker conditions,KKT)条件,剔除对最终结果无用的样本,减少参与训练的样本数目。实验结果表明,与标准支持向量机算法和基于向量投影的支持向量机增量算法相比,基于Fisher向量投影的支持向量机增量算法的训练速度分别提升了86%和33%左右。该方法可用于大规模样本集的分类识别问题。  相似文献   

3.
改进的球结构SVM多分类增量学习算法   总被引:1,自引:0,他引:1  
针对球结构支持向量机(support vector machine,SVM)增量学习算法在训练时间和分类精度上的不足,提出了一种改进的球结构SVM多分类增量学习算法.该算法首先构造一个完全二叉树用于多类分类;分析新增样本的加入对原支持向量集的影响,将新增样本集中部分样本和原始训练集中的支持向量以及分布在球体一定范围内的样本合并做为新的训练集,完成分类器的重构.实现通过减少训练样本缩短训练时间和完善分类器提高分类精度的目的.通过UCI标准数据集实验,结果表明,该算法在所需训练的样本数、训练时间以及准确率3方面都优于球结构SVM增量学习算法,尤其当样本分布不平衡时,该算法有更高的分类准确率.  相似文献   

4.
为进一步改善局部支持向量机的分类效率和分类精度,提出一种改进的局部支持向量机算法。该算法对每类训练样本分别进行聚类,使用聚类生成的样本中心点集代替样本,使用改进的k最近邻算法选取测试样本的k个近邻。分别在UCI数据集和自建树皮图像数据集上对本研究算法的有效性进行测试。实验结果表明,本研究提出的算法在分类精度和效率上具有一定的优势。  相似文献   

5.
支持向量机的快速分类算法   总被引:3,自引:0,他引:3  
支持向量机(SVM)算法在训练集的规模很大特别是支持向量很多时,支持向量机的学习过程需要占用大量的内存,算法的速度较慢。为此,笔者提出一种新的SVM快速分类算法。该算法通过选择边界向量,构造新的训练样本,减少了参与训练的样本数目。实验证明,该算法不仅能保证原算法的精度,具有良好的推广能力,而且提高了算法的速度。  相似文献   

6.
针对给定的大规模数据集的回归估计问题,提出基于支持向量机的模糊回归估计方法.该方法把复杂的数据集看作多个群体的混合,每个群体采用单一的回归模型进行描述,使得大规模数据集的回归估计问题变成了一个多模型估计问题.在此基础上把支持向量机与模糊C聚类结合起来得到基于支持向量机的模糊回归模型,并给出了实现该模型回归估计的算法.该方法对大规模的数据样本进行模糊C聚类,并回归估计各聚类的数据样本.数值仿真结果表明,该方法在聚类数据样本的同时能实现多个模型的回归估计,而且模糊隶属度的初始化影响要小于其他的模糊回归估计方法.  相似文献   

7.
运用OPTICS算法能发现任意形状的聚类,且对输入参数不敏感的优势,提出一种基于OPTICS密度聚类的支持向量机算法,通过对原始数据进行预处理,利用可达图得到约简样本代替原始训练样本用支持向量机进行训练,降低了SVM训练所需的时间及空间复杂度.实验表明,该方法在保持分类精度的同时,大大缩短了训练时间,提高了分类效率.  相似文献   

8.
通过分析入侵检测样本的分布特点,提出了一种多分类SVM增量学习算法.该算法通过衡量同类样本点和样本中心之间的距离来确定用于训练的支持向量,以选择对分类贡献较大的边缘向量进行训练,通过求解多个超平面的方法划分出不同类别样本的区域,实现了多分类的增量学习.在保证检测率的同时,减少了样本学习数量.利用KDDCUP99标准数据集进行测试,证明该算法可以大幅度降低训练的时间和空间复杂度.  相似文献   

9.
为了利用不断积累的网络样本提高故障诊断效能,针对标准支持向量机不直接支持增量学习的问题,提出一种边界偏转覆盖增量支持向量机. 根据违背Karush Kuhn Tucker条件的新增样本在特征空间中可引起原分类边界改变的情况,设计边界偏转覆盖算法预选支持向量再生区作为增量训练工作集,解决了难以确定的非支持向量向支持向量的转化问题. 理论分析和实验结果表明,该方法能有效简化训练工作集,在保证故障诊断精度的同时大幅度提高增量训练效率.  相似文献   

10.
基于壳向量的线性支持向量机快速增量学习算法   总被引:7,自引:0,他引:7  
提出了一种新的基于壳向量的增量式支持向量机快速学习算法.在增量学习的过程中,利用训练样本集中的几何信息,在样本中选取一部分最有可能成为支持向量的样本--壳向量,它是支持向量集的一个规模较小的扩展集,将其作为新的训练样本集,再进行支持向量训练.这在很大程度上减少了求取支持向量过程中的二次优化运算时间,使增量学习的训练速度大为提高.与单纯使用支持向量代表样本数据集合进行增量学习的传统算法相比,使用该算法使分类精度得到了提高.针对肝功能检测标准数据集(BUPA)的实验验证了该算法的有效性.  相似文献   

11.
深度学习模型训练需要大量的有标签数据进行训练,现实生活中数据大多没有标签,需要进行人工标注,对于小样本的训练存在过拟合现象,针对此问题,本文提出一种算法:首先采用稀疏编码器对数据进行降维处理,然后利用T-SNE算法继续将数据维度降低到二维空间,最后采用高斯混合模型对数据进行聚类分析。该算法采用无监督斱法,不需要预先对数据进行标签化。该算法对数据过拟合具有一定的泛化能力,在手写数据集的训练集取得0.89205的准确度,在测试集中取得0.896的精度。该算法为小样本的学习提供了新思路。  相似文献   

12.
普通的支持向量机算法在对大规模样本进行分类的时候有着较高的时间代价。随着训练样本数量的增多,支持向量机的训练速度问题将会越发明显,并且成为制约其实际应用的瓶颈。针对此问题提出了超椭球面方法,通过去掉噪声点、冗余点,并保留能明确体现样本在空间分布位置特征的样本点,以达到提高支持向量机对大规模样本训练速度的目的。实验表明,超椭球面法在最大限度保证识别正确率的前提下可以大幅加快支持向量机的训练速度。  相似文献   

13.
为提高半监督分类的性能,提出一种安全的基于分歧的半监督分类算法Safe Co-SSC。通过有标记样本训练3个有监督分类器,利用无标记样本的信息增加分类器的差异性,采取3个分类器加权投票的策略实现对无标记样本的伪标记;对伪标记样本进行二次验证,选用能使分类器误差减小的新增标记样本扩充标记样本集。保证新样本的添加既减小了分类器的分类误差,又提高了分类器的分歧性。对UCI数据集进行分类实验的结果表明,该算法具有较高的分类率和样本标记率。    相似文献   

14.
&#  &#  &#  &#  &# 《西华大学学报(自然科学版)》2015,34(6):53-57
为提高网络入侵检测的分类效率,提出一种结合主动学习和半监督学习的入侵检测算法。结合入侵检测实际,对主动学习算法进行简化,用有标记样本训练生成2个分类器,实现对未标记样本的预测;将2个分类器预测不一致的未标记样本作为信息量丰富的样本,使用半监督学习算法进行标记;最后, 把新增加的新标记样本添加到主动学习和半监督学习的训练集中,训练各自分类器, 反复迭代直到未标记样本集为空, 并用最新的有标记样本集训练形成最终的分类器。使用KDD CUP 99数据集进行入侵检测实验,其结果表明,与SVM方法相比,其分类率提高了4.3%,且较好地缩减了问题规模。    相似文献   

15.
大规模的训练集中通常含有许多相似样本和大量对分类器模型构造“无用”的冗余信息,利用全部样本进行训练不但会增加训练时间,还可能因为出现“过拟合”现象而导致泛化能力下降。针对这一问题,本文从最具代表性样本与最近边界样本两个角度综合考虑,提出一种基于改进加权压缩近邻与最近边界规则SVM训练样本约减选择算法。该算法考虑到有价值训练样本对SVM分类器性能的重要影响,引进减法聚类利用改进的加权压缩近邻方法选择最具代表性的样本进行训练,在此基础上利用最近边界规则在随机小样本池中选择边界样本提高分类精度。在UCI和KDD Cup 1999数据集上的实验结果表明,本文的算法能够有效地去除大训练集中的冗余信息,以较少的样本获得更好的分类性能。  相似文献   

16.
神经网络训练集中含有大量相似样本不但增加了网络的训练时间还对网络泛化能力存在较大影响,合理的选择样本集训练神经网络模型影响着建模的效率。根据实际应用中神经网络学习样本具有的内在特征和规律性,提出了一种基于自组织映射(SOM)神经网络的K-均值聚类算法优选神经网络样本,算法的主要思想是通过对样本数据的聚类分析,剔除孤立样本后挑选出具有代表性的样本训练神经网络。实验结果表明,相对随机选择法而言,本算法能够有效地减少训练样本的数目,提高建模效率。  相似文献   

17.
提出了一种基于加权特征的图像自动标注方法.该方法首先采用加权特征聚类算法对图像区域进行语义聚类,这种聚类算法根据图像特征的统计分布来计算特征与类别的相关度,增加相关度高的特征的权重,避免聚类算法被弱相关或不相关的特征所支配;然后,根据训练集中样本图像的标注情况建立图像区域与语义关键字的关联;最后,在未标注图像区域给定时,计算每个语义关键字的条件概率,将条件概率最大的语义概念作为图像的标注. 在Corel图像库的数据集上验证了新方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号