首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
改进的球结构SVM多分类增量学习算法   总被引:1,自引:0,他引:1  
针对球结构支持向量机(support vector machine,SVM)增量学习算法在训练时间和分类精度上的不足,提出了一种改进的球结构SVM多分类增量学习算法.该算法首先构造一个完全二叉树用于多类分类;分析新增样本的加入对原支持向量集的影响,将新增样本集中部分样本和原始训练集中的支持向量以及分布在球体一定范围内的样本合并做为新的训练集,完成分类器的重构.实现通过减少训练样本缩短训练时间和完善分类器提高分类精度的目的.通过UCI标准数据集实验,结果表明,该算法在所需训练的样本数、训练时间以及准确率3方面都优于球结构SVM增量学习算法,尤其当样本分布不平衡时,该算法有更高的分类准确率.  相似文献   

2.
为了解决因软件缺陷数据存在数据不平衡问题限制了分类器的性能,将POSS(pareto optimization for subset selection)特征选择算法和随机欠采样技术引入到软件缺陷检测中,并利用支持向量机(support vector machine, SVM)构建预测模型。试验结果表明,通过多次随机欠采样可以有效地解决软件缺陷数据不平衡问题,同时使用POSS方法对目标子集进行双向优化,从而提高分类的准确率,其结果要优于Relief、Fisher、MI(mutual information)特征选择算法。  相似文献   

3.
并行PSVM算法及其在入侵检测中的应用(英文)   总被引:1,自引:1,他引:0  
基于并行PSVM(proximal support vector machine)分类法,利用ε-支持向量与原数据集等价的特点,将PSVM和cascade SVM模型高效结合,加速训练入侵数据集.提出一种新的PSVM增量学习方法,它能快捷更新分类器.通过大量基于著名的KDD CUP1999数据集实验,研究表明,该算法相对其他SVM方法,在保证较高检测率和较低误报率的同时,其训练时间降低80%,且能通过增量学习新数据集来有效更新分类器.  相似文献   

4.
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出基于近邻密度改进的SVM(NDSVM)不平衡数据集分类算法.该算法先计算多数类内每个样本的近邻密度值,然后依据该密度值选出多数类中位于边界区域、靠近边界区域的与少数类数目相等的样本分别与少数类完成SVM初始分类,最后用所得的支持向量机和剩余的多数类样本完成初始分类器迭代优化.人工数据集和UCI数据集的实验结果表明,与WSVM、ALSMOTE -SVM和基本SVM算法相比,本文算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能.  相似文献   

5.
基于人工蜂群和SVM的基因表达数据分类   总被引:1,自引:1,他引:0  
基因表达数据存在高维、小样本、高噪声等特性,使得相应的肿瘤分类诊断面临着一定的挑战。为了实现更加精确的分类准确率,利用人工蜂群(artificial bee colony, ABC)算法对支持向量机(support vector machine, SVM)的核函数参数和惩罚因子进行优化,采用准确率作为分类模型的适应度函数,提出一种基于ABC和SVM的基因表达数据分类方法ABC-SVM。在6种公开的肿瘤基因表达数据集上进行试验,并对比分析其他的分类方法。结果表明,在筛选得到的较少信息基因基础上,ABC-SVM可获得更高的肿瘤分类准确率,对肿瘤样本类型进行更有效的分类预测。  相似文献   

6.
用支持向量机方法识别大肠杆菌启动子   总被引:3,自引:1,他引:2  
为了进一步研究大肠杆菌启动子的识别算法,结合大肠杆菌基因分子生物学的有关理论,利用支持向量机(support vector machine,SVM)方法对启动子进行了识别.根据启动子的序列保守性,从每个启动子样本中选取了长65bases的序列作为正样本,从大肠杆菌编码区选取相应长度的序列作为负样本,建立了基于支持向量机的分类器;并讨论了应用SVM方法时,核函数参数的选择问题.实验结果表明,基于支持向量机的识别方法能更好地提取启动子保守序列的统计特征,正样本和负样本的相关系数可以达到81.62%.  相似文献   

7.
为实现利用机器视觉代替人工视觉对脐橙进行品质分级检测,采用数字形态学方法把脐橙从背景中分离出来,并提取脐橙的体积、果面缺陷、颜色和纹理等几个主要特征.以这些特征量为支持向量机(support vector machine,SVM)的输入特征向量进行SVM分类器训练.最后,用该分类器进行脐橙分级检测.实验结果表明:该分类器具有正确识别率高、实时性好的特点,适合于实时环境下的脐橙分级检测.  相似文献   

8.
多分类支持向量机在公交换乘识别中的应用   总被引:1,自引:0,他引:1  
为获取居民公交出行的换乘信息,设计了一套基于多分类支持向量机(multi-class support vector machine)的公交换乘识别方法.通过融合GPS数据和公交IC卡数据获取训练样本,利用多分类支持向量机进行样本训练,选取最佳训练样本量,并采用网格搜索法结合粒子优化算法对模型参数进行标定,以获取最优SVM分类模型.测试结果显示模型分类精度可达90%.以佛山市公交车GPS数据和IC卡数据对算法进行验证,并获取公交换乘量、公交换乘比例等基本换乘数据.结果表明:算法可在少样本条件下完成公交换乘识别,且分类识别精度高,尤其适用于公交线网复杂的大城市公交换乘识别,有助于在公交前期规划时进行线路布设和枢纽选址.  相似文献   

9.
为了提高机器学习在大数据集中的学习性能,提出了一种基于局部敏感Hash的半监督支持向量机增量学习算法.首先利用局部敏感Hash能快速查找相似数据特性的能力,筛选出第一次增量中与有标签样本相似的样本,通过TSVM(Transductive support vector machine)得到支持向量并筛选出再次增量中有可能成为支持向量的无标记样本,然后与已有支持向量和有标签样本一起作为后续训练的基础,最后使用多个数据集对算法进行验证.实验表明:提出的半监督TSVM增量学习算法能有效地提高训练学习的速度和分类准确率.  相似文献   

10.
为提高螺丝锁附结果分类的正确性,本文以采集的苹果手机螺丝锁附过程的受力数据为依据,基于支持向量机(support vector machine,SVM)算法,对螺丝锁附结果分类进行研究。通过重采样和归一化的方法,对所采集的数据进行预处理,并采用支持向量机算法对数据进行训练,同时采用网格搜索算法寻找最优参数C与σ2,为检验模型的好坏,采用验证集将400组验证数据输入到模型中。研究结果表明,在400组验证数据中,第399组数据分类错误,误差率为0.25%,在允许范围内。该研究对螺丝安装或拆卸速度及准确性的提高具有重要意义。  相似文献   

11.
多源性数据SVM集成算法研究   总被引:1,自引:0,他引:1  
针对数据特征的多源性特点,提出基于分组特征支持向量机集成算法.该方法将特征分组,对不同组特征采用不同的核函数映射到高维空间后用支持向量机分类,最后采用投票的方法得出决策标记,所得到的成员分类器具有较高的差异性.与传统的集成方法相比,该方法具有较好的检测性能.  相似文献   

12.
入侵检测实质上可以被描述为对数据样本进行尽可能正确的分类,关键问题是特征选择和模式识别方法的选择.采用SVM分类器组合的方法对数据样本进行分类,结合协议分析技术,提出了基于协议分析和SVM多分类的入侵检测系统模型,并利用KDD CUP 99数据集对系统模型进行测试.测试结果表明,所提出的方法有效提高了入侵检测的效率,降低了漏报率和误报率.  相似文献   

13.
基于多支持向量机分类器的增量学习算法研究   总被引:1,自引:0,他引:1  
为了将一般增量学习算法扩展到并行计算环境中,提出一种基于多支持向量机分类器的增量学习算法.该算法根据多分类器对新增样本集的分类结果,以样本到分类超平面的平均距离为条件重新构造支持向量集更新分类器,直到所有分类器的分类精度满足指定阈值.实验结果表明了该算法的可行性和正确性.  相似文献   

14.
依据AdaBoost思想对BP神经网络、线性判别式以及支撑向量机三种传统分类器进行强化训练形成强分类器。在传统训练的基础上,根据分类器的映射特点选择相应的预处理方法和权值分布函数,降低分类器对数据特点的依赖性,提高AdaBoost的训练效果。对基于左右手运动想象的实际脑电数据进行模式分类,发现采用该思想训练的强分类器能不同程度地提高分类效果。该算法具有一定的推广意义,也证实了AdaBoost算法在脑机接口技术开发中的应用潜力。  相似文献   

15.
为了降低支持向量机对不平衡数据的倾向性影响,以及减弱其对噪声点或野值点的敏感,提出了一种新的模糊支持向量机隶属度函数设计方法.该方法分析产生倾向性的原因,有效地区分样本对分类面的贡献,合理地设计隶属度函数.最后通过对含噪声的非均衡数据实验表明,该方法平衡了倾向性,提高了预测分类精度,从而增强了支持向量机在入侵检测和故障诊断等方面的应用.  相似文献   

16.
为提高半监督分类的性能,提出一种安全的基于分歧的半监督分类算法Safe Co-SSC。通过有标记样本训练3个有监督分类器,利用无标记样本的信息增加分类器的差异性,采取3个分类器加权投票的策略实现对无标记样本的伪标记;对伪标记样本进行二次验证,选用能使分类器误差减小的新增标记样本扩充标记样本集。保证新样本的添加既减小了分类器的分类误差,又提高了分类器的分歧性。对UCI数据集进行分类实验的结果表明,该算法具有较高的分类率和样本标记率。    相似文献   

17.
针对高维、小样本及不确定性的基因表达数据,融合模糊可容忍性的邻域粒化技术与具有全局寻优能力的鱼群智能算法,提出基于邻域粗糙集与鱼群智能的基因选择方法。首先,采用邻域粗糙集对基因数据进行邻域粒化,形成邻域粒子;其次,提出基于邻域分类精度的不确定性评价函数,用以评价邻域粒子的不确定性,分辨关键性基因;进一步融合鱼群智能方法,设计一种基因选择算法,选取分类性强的少量关键基因;最后,在两个癌症基因数据集中进行基因选择,采用SVM分类器对获取的关键基因组进行分类实验。实验结果表明,采用该方法获取的基因组具有较低的冗余度及较好的分类性能。  相似文献   

18.
为了提高支持向量机(SVM)在多类分类中的分类效果,提出了一种基于改进粒子群优化(IMPSO)算法和协作式递归神经网络(CRNN)的多类SVM分类方法(IMPSO_CRNN_SVM算法).首先引入自适应惯性权重及自适应粒子变异,以此改进粒子群优化算法(PSO)在优化SVM参数过程中存在的容易陷入局部最优和早熟等问题; 然后基于多类SVM设计一个CRNN,并利用随机分配的训练集对该网络进行训练并构建最终决策函数,从而实现多类数据的“一次性”分类.最后利用3种数据集和实际应用对IMPSO_CRNN_SVM算法进行验证,结果表明IMPSO_CRNN_SVM算法的分类精度优于未进行参数优化的传统SVM算法、基本PSO 进行SVM参数优化的算法和未进行PSO参数优化的基于CRNN的多类支持向量机算法,因此IMPSO_CRNN_SVM算法具有一定的实用性.  相似文献   

19.
针对隐含概念漂移和噪声的数据流,提出一种基于模糊积分融合的数据流分类方法(fuzzy integral ensemble classifiers for mining data streams, FI-MDS)。将模糊积分融合方法与集成综合技术有效结合起来,首先通过基分类器对识别样例进行分类得到决策剖面,然后再用模糊积分融合方法得到最终的分类结果,同时引入动态权值更新以提高算法的适应性。实验结果表明,与传统的数据流分类算法相比,该方法提高了概念漂移的检测精度,有效地解决了数据流中复杂分类问题,具有良好的分类性和健壮性。  相似文献   

20.
常用的排列法从微阵列数据中选择的基因集合会包含相关性较高的基因,这会影响分类器的性能,为了去除这些冗余基因(特征),提出了无监督的特征选择算法.该算法主要包含:将原始特征集划分为一组相似的子集(聚类);从每个聚类中选择代表性特征.特征的划分采用特征间的相关性作为测度以k近邻原则来完成.该算法无需指定聚类数量,时间复杂度低.真实的生物学数据实验证明该算法可显著提高分类器的分类准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号