首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
分析了现有多类分类支持向量机算法的不足,在此基础上提出了基于类半径的多类分类支持向量机算法.这种算法在训练前首先对训练集进行分析,然后用one-class SVM进行分类.试验结果表明,该算法分类精度较高,训练时间短.  相似文献   

2.
为了提高模糊支持向量机在大规模数据集上的训练效率,提出了一种基于聚类粒度的模糊支持向量机算法.首先在每类训练样本上执行无监督聚类算法,产生聚类颗粒.在综合考虑了聚类中心、半径和聚类中的样本数目等聚类信息基础上,找到每个聚类内部的边缘点和交叉点集合,去除对分类贡献很小的聚类内部点,最终形成了新的用于模糊支持向量机训练的样本集合.随后的试验结果表明,由聚类颗粒生成的约简样本集合,很好的表示了原有样本的分布,不仅提高了训练效率,同时保持了较好的分类效果.  相似文献   

3.
基于SVM的多类分类算法改进   总被引:1,自引:0,他引:1  
在各种基于支持向量机的多类分类算法中,基于二叉树的多类支持向量机分类算法训练和分类速度相对较快,且解决了不可分问题,是一种很好的方法.本文系统研究和分析了基于二叉树的多类支持向量机分类算法,并在此基础上对其作出了改进,即当测试文本集规模较大时,对其先聚类再分类.改进的目的是,使测试文本不必总是从二叉树的根结点开始进行判断,而是有指导的代入分类函数中计算.在测试文本集规模较大,分类函数个数较多时,可以很大程度上增加分类效率,并加大了文本正确分类的概率.  相似文献   

4.
针对传统半监督支持向量机的高斯核函数无法恰当描述流形数据特性,从而导致流形数据分类精度下降的问题,提出一种基于谱聚类的聚类核半监督支持向量机.利用谱聚类方法在特征向量空间中对原始样本数据进行重新表述,使得在新表述中同一聚类中的样本能够更好地积聚在一起,构建聚类核函数,并进而构造聚类核半监督支持向量机,使样本更好地满足半监督学习必须遵循的聚类假设.研究结果表明:聚类核半监督支持向量机对未标记样本的分类精度高且算法性能稳定,对控制参数的设置不敏感,适于解决流形数据的分类问题.  相似文献   

5.
针对传统的基于决策树的支持向量机多类分类算法运算过程复杂、分类效率低的缺点,提出一种新的基于聚类思想的支持向量机分类方法.空间距离和聚类思想的引入,有效的提高了算法的分类效率.仿真试验表明,该方法在保持算法良好推广性的同时降低了算法的复杂度,从而提高了分类效率和分类速度.  相似文献   

6.
基于支持向量机的网页分类技术是数据挖掘中一个研究热点领域.支持向量机是一种高效的分类识别方法,在解决高维模式识别问题中表现出许多特有的优势,但支持向量机本身是一个两类问题的判别方法,不能直接应用于多类问题.总结了当前常用的几种支持向量机多类分类算法,分别从训练速度、测试速度、分类精度三方面对这些分类方法进行了讨论,并给出了进一步的研究方向.  相似文献   

7.
针对互联网热点信息发现的需求,提出一种基于先分类再聚类的互联网信息热点发现及分析系统构建方法.通过对互联网样本信息文本的特征提取,构建文本向量空间模型,使用Maxent最大熵分类模型对文本进行分类,对分类结果使用OPTICS聚类算法获取文本热点簇,最终获取有效热点信息.实验证明,通过先分类再聚类的方法可以有效避免语义类别不同但字面意义混淆的文章对聚类算法的影响,有效提高聚类结果的精度和运算效率.  相似文献   

8.
改进的球结构SVM多分类增量学习算法   总被引:1,自引:0,他引:1  
针对球结构支持向量机(support vector machine,SVM)增量学习算法在训练时间和分类精度上的不足,提出了一种改进的球结构SVM多分类增量学习算法.该算法首先构造一个完全二叉树用于多类分类;分析新增样本的加入对原支持向量集的影响,将新增样本集中部分样本和原始训练集中的支持向量以及分布在球体一定范围内的样本合并做为新的训练集,完成分类器的重构.实现通过减少训练样本缩短训练时间和完善分类器提高分类精度的目的.通过UCI标准数据集实验,结果表明,该算法在所需训练的样本数、训练时间以及准确率3方面都优于球结构SVM增量学习算法,尤其当样本分布不平衡时,该算法有更高的分类准确率.  相似文献   

9.
基于核K-均值聚类和支持向量机结合的说话人识别方法   总被引:1,自引:0,他引:1  
提出了基于核K-均值聚类方法与支持向量机结合的说话人识别方法,为每两个人建立一个支持向量机,对支持向量机输入的语音信号先进行核K-均值聚类,并选取有效样本作为支持向量机的输入,本文提出的聚类方法能够去更好的聚类并约简数据,提高了识别率.实验比较了在用支持向量机作为分类器的情况下,该核聚类与传统聚类方法的训练速度和识别性能,验证了本文提出方法的有效性.  相似文献   

10.
传统支持向量机在处理包含大量未知类别样本的训练集时性能较差。针对这一不足,在少量已知类别样本和大量未知类别样本构成的训练集上,提出一种基于蚁群聚类算法的支持向量机半监督式学习方法。该方法应用蚁群聚类算法进行聚类分析,实现了同类样本的自组织聚类;通过一个递归的类别判定算法,回收样本类别;同时,提取各类簇之间靠得相对较近的边界样本组成精简训练集,以缩减训练集规模加快学习速度。实验表明,该算法能够自适应样本类别分布,有较高的分类精度和泛化能力。  相似文献   

11.
针对DBN处理小样本脑电信号训练时间长且存在过拟合的问题,提出基于随机隐退的DBN算法对左右手运动想象脑电信号进行分类识别.先对原始脑电数据进行降维预处理,然后输入到随机隐退DBN模型中进行训练,得到最优参数值后进行分类识别.实验结果表明:与CSP、PCA、单一DBN网络等方法相比,基于随机隐退的DBN算法在保持较高识别率的同时,降低了对数据集的训练处理时间,证明了该方法的有效性.最后在智能轮椅平台上验证了该算法的可行性.  相似文献   

12.
针对传统的增式支持向量机算法在计算时间和分类效率上的不足,提出了一种新型的增式SVM训练算法。该算法不是简单地保留上一步训练的支持向量,而是通过增加KKT(Karush-Kuhn-Tucke)限制条件并对决策函数的输出设定一个阈值,使得保留下来的样本都是最有效的样本,从而可减少训练样本的数目。在仿真实验中,选择了一组UCI数据,并选用RBF核函数作为核函数。实验结果表明:与传统增式算法相比,新算法在保证传统SVM性能的同时,在迭代速度和分类放率上分别提高了14%和4.39%。  相似文献   

13.
基于壳向量的线性支持向量机快速增量学习算法   总被引:7,自引:0,他引:7  
提出了一种新的基于壳向量的增量式支持向量机快速学习算法.在增量学习的过程中,利用训练样本集中的几何信息,在样本中选取一部分最有可能成为支持向量的样本--壳向量,它是支持向量集的一个规模较小的扩展集,将其作为新的训练样本集,再进行支持向量训练.这在很大程度上减少了求取支持向量过程中的二次优化运算时间,使增量学习的训练速度大为提高.与单纯使用支持向量代表样本数据集合进行增量学习的传统算法相比,使用该算法使分类精度得到了提高.针对肝功能检测标准数据集(BUPA)的实验验证了该算法的有效性.  相似文献   

14.
针对信息增益算法只能考察特征对整个系统的贡献、忽略特征对单个类别的信息贡献的问题,提出改进信息增益算法,通过引入权重系数调整对分类有重要价值的特征的信息增益值,以更好地考虑一个词在类别间的分布不均匀性. 针对传统专利自动分类中训练集标注瓶颈问题,提出基于改进三体训练算法的半监督分类方法,通过追踪每次更新后的训练集样本类别分布来动态改变3个分类器对同一未标记样本类别的预测概率阈值,从而在降低噪音数据影响的同时实现对未标记训练样本的充分利用. 实验结果表明,本研究所提出的分类方法在有标记训练样本较少的情况下,可以取得较好的自动分类效果,并且适当增大未标记样本数据可以增强分类器的泛化能力.  相似文献   

15.
&#  &#  &#  &#  &# 《西华大学学报(自然科学版)》2015,34(6):53-57
为提高网络入侵检测的分类效率,提出一种结合主动学习和半监督学习的入侵检测算法。结合入侵检测实际,对主动学习算法进行简化,用有标记样本训练生成2个分类器,实现对未标记样本的预测;将2个分类器预测不一致的未标记样本作为信息量丰富的样本,使用半监督学习算法进行标记;最后, 把新增加的新标记样本添加到主动学习和半监督学习的训练集中,训练各自分类器, 反复迭代直到未标记样本集为空, 并用最新的有标记样本集训练形成最终的分类器。使用KDD CUP 99数据集进行入侵检测实验,其结果表明,与SVM方法相比,其分类率提高了4.3%,且较好地缩减了问题规模。    相似文献   

16.
普通的支持向量机算法在对大规模样本进行分类的时候有着较高的时间代价。随着训练样本数量的增多,支持向量机的训练速度问题将会越发明显,并且成为制约其实际应用的瓶颈。针对此问题提出了超椭球面方法,通过去掉噪声点、冗余点,并保留能明确体现样本在空间分布位置特征的样本点,以达到提高支持向量机对大规模样本训练速度的目的。实验表明,超椭球面法在最大限度保证识别正确率的前提下可以大幅加快支持向量机的训练速度。  相似文献   

17.
自动分类是数据挖掘和机器学习中非常重要的研究领域.针对难以获得大量有类标签的训练集问题,提出了基于小规模训练集的增量式贝叶斯分类,给出增量式贝叶斯分类机理参数计算及其算法.对算法分两种情况处理:第一种情况是新增样本有类别标签,则利用现有分类器检验其类标签,如果匹配则保留当前分类器,否则利用新样本修正分类器;第二种情况是新增样本无类别标签,则利用现有分类器为其训练类标签,然后利用新样本来修正分类器.实验结果表明,该算法是可行有效的,比简单贝叶斯分类算法有更高的精度.增量式贝叶斯分类算法的提出为分类器的更新提供了一条新途径.  相似文献   

18.
大规模的训练集中通常含有许多相似样本和大量对分类器模型构造“无用”的冗余信息,利用全部样本进行训练不但会增加训练时间,还可能因为出现“过拟合”现象而导致泛化能力下降。针对这一问题,本文从最具代表性样本与最近边界样本两个角度综合考虑,提出一种基于改进加权压缩近邻与最近边界规则SVM训练样本约减选择算法。该算法考虑到有价值训练样本对SVM分类器性能的重要影响,引进减法聚类利用改进的加权压缩近邻方法选择最具代表性的样本进行训练,在此基础上利用最近边界规则在随机小样本池中选择边界样本提高分类精度。在UCI和KDD Cup 1999数据集上的实验结果表明,本文的算法能够有效地去除大训练集中的冗余信息,以较少的样本获得更好的分类性能。  相似文献   

19.
文本自动分类是数据挖掘和机器学习中非常重要的研究领域 .针对难以获得大量有类标签的训练集问题 ,提出了基于小规模标注语料的增量式Bayes文本分类算法 .该算法分两种情况处理 :第一种情况是新增样本有类标签 ,可直接重新计算样本属于某类别的条件概率 .第二种情况是新增样本无类标签 ,则利用现有分类器为其训练类标签 ,然后利用新样本来修正分类器 .实验结果表明 ,该算法是可行有效的 ,比Na veBayes文本分类算法有更高的精度 .增量式Bayes分类算法的提出为分类器的更新提供了一条新途径  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号