首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
一种改进的主动支持向量机算法及其应用   总被引:1,自引:1,他引:0       下载免费PDF全文
针对支持向量机中分类器易受样本孤立点影响的问题,提出一种改进的主动支持向量机算法,采用K—means算法获取少量“代表性”样本作为训练样本,通过训练该标识样本得到一个初始分类器,利用主动学习策略选择最佳未标记样本进行类别标记,并加入训练样本集重新训练分类器,重复该过程直到满足某些要求。运用Iris数据和遥感数据对其进行测试,实验结果表明,该算法是有效的。  相似文献   

2.
提出一种集成主动学习和支持向量机的学习算法并应用于基于内容的图像检索.首先在相关反馈过程中结合样本不确定性与减小样本间冗余度的采样策略选择样本进行类别标记组成样本集训练支持向量机分类器,然后利用得到的分类器进行图像检索,直至用户满意为止.基于遥感影像的实验表明,算法能够提高基于内容的图像检索的效率和性能.  相似文献   

3.
为解决监督学习过程中难以获得大量带有类标记样本且样本数据标记代价较高的问题,结合主动学习和半监督学习方法,提出基于Tri-training半监督学习和凸壳向量的SVM主动学习算法.通过计算样本集的壳向量,选择最有可能成为支持向量的壳向量进行标记.为解决以往主动学习算法在选择最富有信息量的样本标记后,不再进一步利用未标记样本的问题,将Tri-training半监督学习方法引入SVM主动学习过程,选择类标记置信度高的未标记样本加入训练样本集,利用未标记样本集中有利于学习器的信息.在UCI数据集上的实验表明,文中算法在标记样本较少时获得分类准确率较高和泛化性能较好的SVM分类器,降低SVM训练学习的样本标记代价.  相似文献   

4.
传统支持向量机通常关注于数据分布的边缘样本,支持向量通常在这些边缘样本中产生。本文提出一个新的支持向量算法,该算法的支持向量从全局的数据分布中产生,其稀疏性能在大部分数据集上远远优于经典支持向量机算法。该算法在多类问题上的时间复杂度仅等价于原支持向量机算法的二值问题,解决了设计多类算法时变量数目庞大或者二值子分类器数目过多的问题。  相似文献   

5.
模糊支持向量机具有很好的抗噪声能力,受到很多专家的重视。然而模糊支持向量机上的主动学习算法却一直鲜有研究。提出一种针对模糊支持向量机的主动学习算法,该算法首先在训练集合上利用模糊支持向量机得到决策超平面,然后选取间隔内的未标记样本进行标记,并计算相应的模糊权重,以及更新原有训练样本的模糊权重。最后结合赋予模糊权重的新标记样本重新进行学习,直到未标记样本集为空或者分类性能满足要求。在UCI标准数据集和语音识别数据集上的实验充分验证了该算法的有效性。  相似文献   

6.
为了解决大样本集标记工作问题和分类器对新样本分类适应能力差的问题,结合球结构支持向量机,提出了一种主动学习自适应性分类方法。该方法根据主动学习思想,以边界近邻策略迭代选取最有价值的样本,初始训练分类器,再依据增量学习方法选取包含新信息的样本,以阶段跟新方式重新训练分类器,并根据余弦相似度对内存中支持向量进行控制。实验结果表明,该方法既减少了标记开销,又保持了分类器分类性能的稳定性和延续性。  相似文献   

7.
基于半监督学习和支持向量机的煤与瓦斯突出预测研究   总被引:1,自引:1,他引:0  
针对支持向量机要求输入向量为已标记样本,而实际应用中已标记样本很难获取的问题,提出将半监督学习和支持向量机结合的煤与瓦斯突出预测方法;介绍了采用SVM预测煤与瓦斯突出的流程及其输入向量的选择;对半监督学习中的协同训练算法进行了改进:在同一属性集上训练2个不同分类器SVM和KNN,将2个分类器标记一致的样本加入训练集,从而充分利用未标记样本不断补充信息,更新训练集标记样本,达到强化训练集的目的。测试结果表明,改进后的算法比单独的支持向量机预测方法准确率更高。  相似文献   

8.
陈文  晏立  周亮 《计算机工程》2011,37(4):214-215
在正例和无标记样本增量学习中,初始正例样本较少且不同类别正例的反例获取困难,使分类器的分类和泛化能力不强,为解决上述问题,提出一种具有增量学习能力的PU主动学习算法,在使用3个支持向量机进行协同半监督学习的同时,利用基于网格的聚类方法进行无监督学习,当分类与聚类结果不一致时,引入主动学习对无标记样本进行标记。实验结果表明,将该算法应用于Deep Web入口的在线判断和分类能有效提高入口判断的准确性及分类的正确性。  相似文献   

9.
提出了一种基于高斯混合模型核的半监督支持向量机(SVM)分类算法.通过构造高斯混合模型核SVM分类器提供未标示样本信息,使得SVM算法在学习标示样本信息的同时,能够兼顾整个训练样本集合的聚类假设.实验部分将该算法同传统SVM算法、直推式支持向量机(TSVM)以及随机游走(RW)半监督算法进行分类性能比较,结果证明该算法在拥有较少标示样本训练的情况下分类性能也有所提高且具有较高的鲁棒性.  相似文献   

10.
蒋新华    高晟  廖律超    邹复民 《智能系统学报》2015,10(5):690-698
针对交通场景运动车辆检测中车辆数目统计准确率不高、自适应性不强等问题,提出了一种基于半监督支持向量机(SVM)分类算法的交通视频车辆检测方法。利用人工标记的少量样本,分别训练2个基于方向梯度直方图(HOG)特征与基于局部二值模式(LBP)特征的不同核函数的SVM分类器;结合半监督算法的思想,构建SVM的半监督分类方法(SEMI-SVM),标记未知样本并加入到原样本库中,该方法支持样本库动态更新,避免了繁重的人工标记样本的工作,提高了自适应性;最后,通过三帧差分法提取运动区域,加载分类器在该区域进行多尺度检测,标记检测出来的运动车辆,统计车辆数目。实验结果表明:该方法在具有一定的自适应性的同时,有较高的车辆检测准确率,即使在复杂交通情况下,对运动车辆依然有很好的检测效果。  相似文献   

11.
支持向量机算法对噪声和异常点是敏感的,为了克服这个问题,人们引入了模糊隶属度。传统确定样本模糊隶属度的方法,都是基于原始空间的。文章提出了基于特征空间的模糊隶属度函数模型。在该模型中,以特征空间中的样本为中心,以给定的距离d为半径作超球,根据其它样本落到超球内的个数来确定中心样本点的模糊隶属度。并将新的模糊隶属度模型引入自适应支持向量机,提出了模糊自适应支持向量机算法。实验结果表明,该模型能有效地提高自适应支持向量机的抗噪能力和预测精度。  相似文献   

12.
Large-scale Support Vector Machine (SVM) classification is a very active research line in data mining. In recent years, several efficient SVM generation algorithms based on quadratic problems have been proposed, including: Successive OverRelaxation (SOR), Active Support Vector Machines (ASVM) and Lagrangian Support Vector Machines (LSVM). These algorithms have been used to solve classification problems with millions of points. ASVM is perhaps the fastest among them. This paper compares a new projection-based SVM algorithm with ASVM on a selection of real and synthetic data sets. The new algorithm seems competitive in terms of speed and testing accuracy.  相似文献   

13.
针对传统对支持向量机多类分类算法(Multi-TWSVM)中出现的模糊性问题,提出了一种基于遗传算法的决策树对支持向量机(GA-DTTSVM)多类分类算法。GA-DTTSVM用遗传算法对特征数据建立决策树,通过构建决策树可以分离样本的模糊区域,提高模糊区域样本的识别率。在决策树的每个节点上用对支持向量机(TWSVM)训练分类器,最后用训练的分类器进行分类和预测。实验结果表明,与决策树对支持向量机(DTTSVM)多类分类算法以及Multi-TWSVM相比,GA-DTTSVM多类分类算法具有较高的分类精度和较快的训练速度。  相似文献   

14.
支持向量机(SVM)是近年来发展起来的一种通用的机器学习方法,在小样本数据的拟合中已获得了很好的效果。采用新型的支持向量机——最小二乘支持向量机(LS-SVM)对孔隙度、渗透率和饱和度进行了预测,获得了满意的结果。该方法易于使用,很少受不确定性因素的影响,并具有较强的信息整合能力以及更高的预测准确性。  相似文献   

15.
由于极端支持向量分类机(ESVM)在对样本进行分类时并没有考虑到数据集中样本点的分布情况,对所有样本点的误差项都给予了相同的惩罚因子,使得分类器的分类效果很容易受到噪声、野值数据的干扰,针对这个问题,在ESVM的基础上提出了一种基于距离加权的极端支持向量机(WESVM)。由于不同的样本到其类中心距离的不同,因此对不同的样本给予不同的权重。分类实验结果表明WESVM与ELM、ESVM相比具有更好的分类精度。  相似文献   

16.
将支持向量机与半监督学习理论相结合,提出基于支持向量机协同训练的半监督回归模型,使用两个支持向量机回归模型相互影响,协同训练。利用实验数据集进行实验,并与监督支持向量机回归模型、半监督自训练支持向量机回归模型作比较。实验结果表明,基于支持向量机协同训练的半监督回归模型在缺少标记样本的情况下,提高了回归估计的精度。  相似文献   

17.
为了提高大型公共交通短期客流预测精度,提出了一种在利用集成经验模态分解原始数据的条件下,采用灰狼优化算法优化最小二乘支持向量机(EEMD-GWO-LSSVM)的算法,利用该算法实现城市大型公共交通短期客流预测。该模型采用EEMD分解原始数据,将分解后的各个本征模函数(IMF)分量运用最小二乘支持向量机进行回归预测,最小二乘支持向量机的预测参数由灰狼算法进行优化。通过对西安地铁二号线北客站一个月进出站人数进行训练预测,将预测结果和支持向量机(SVM),自回归移动平均模型(ARIMA),仅利用灰狼优化参数的最小二乘支持向量机(GWO-LSSVM)算法以及基于交叉检验进行参数优化的最小二乘支持向量机进行对比,分析得出该算法具有更加精确的预测结果。  相似文献   

18.
对肿瘤基因表达谱进行分析,从而有效区分正常样本与肿瘤样本的关键是:准确找出能够决定样本类别的最少特征基因,并用一个性能较好的分类器进行分类预测。针对该问题,用修订的特征记分准则(RFSC)去除分类无关基因;对两两冗余法进行改进,提出强相关树法用于冗余基因的去除;对粗糙支持向量机(RSVM)改进,提出近似等价粗糙支持向量机(AE-RSVM)对样本集进行分类测试。以肿瘤样本集为例进行测试,实验结果表明了提出方法的可行性和有效性。  相似文献   

19.
为了对网络流量进行准确预测,针对传统极限学习机的“过拟合”不足,提出一种极限学习机和最小二乘支持向量机相融合的网络流量预测模型(ELM-LSSVM)。该模型通过相空间重构获得网络流量的学习样本,引入最小二乘支持向量机对极限学习进行改进,并对网络流量训练集进行学习,采用仿真实验对模型性能进行测试。结果表明,ELM-LSSVM提高了网络流量的预测精度,实现了网络流量准确预测,并具有较强的实际应用价值。  相似文献   

20.
使用SVM提供的卷积树核函数构造一个中文语义角色标注系统,将依存关系作为标注单元进行中文语义角色标注。通过不同的裁剪方法获得依存树的结构化信息,裁剪后的依存树分别为最短路径树和最小树。在中文PropBank和NomBank的转换语料上进行实验,结果表明,该系统在动词性谓词和名词性谓词语料上的F1值分别为83.66和76.87。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号