首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 375 毫秒
1.
为了处理大规模数据和不平衡数据分类问题,提出了一种新的分类方法,利用基于最大夹角间隔的核心集向量机算法实现对大样本数据的分类;针对不平衡数据分类问题,通过对不同的样本给予不同的权重,来提高算法的分类性能。加权最大夹角间隔核心集向量机方法不仅能够有效地解决不平衡数据的分类问题,而且能够实现对大样本数据的快速训练。  相似文献   

2.
当前主流分类方法在分类决策时无法同时考虑样本的全局特征和局部特征,而且大多算法仅关注各类样本的可分性,往往忽略样本之间的相对关系。为了解决上述问题,提出了基于流形判别分析的全局保序学习机。该方法引入流形判别分析来反映样本的全局特征和局部特征;通过保持各类样本中心的相对关系不变进而实现保持全体样本的先后顺序不变;借鉴核心向量机有关理论和方法,通过建立所提方法与核心向量机对偶形式的等价关系实现大规模分类。人工数据集和标准数据集上的比较实验验证了该方法的有效性。  相似文献   

3.
为了解决大规模非线性分类中局部学习的不平衡性问题,提出一种改进的局部支持向量机算法,在高维特征空间中聚类后,为每一个簇构造局部非线性支持向量机。为了克服簇内样本的分布不均衡问题,根据闭合超平面不规则边界的几何特点,经过梯度下降寻找稳定均衡向量,以此构造簇几何中心;再结合簇密度中心共同约束类心形成双重加权中心。然后通过求解加权最小闭球问题实现对大规模样本向量的分类。对照实验显示,除了个别数据集以外,改进的算法在训练时间、测试时间以及测试精度等方面都比另外两种分类算法表现更佳。  相似文献   

4.
针对支持向量机训练样本冗余导致训练效率低下的问题,提出一种基于Fisher向量投影的支持向量机增量算法。该算法根据支持向量机中支持向量的分布特性对初始训练集及增量集进行预处理,减少训练样本个数;通过判断初始样本是否满足新增样本集的卡罗需-库恩-塔克(Karush-Kuhn-Tucker conditions,KKT)条件,剔除对最终结果无用的样本,减少参与训练的样本数目。实验结果表明,与标准支持向量机算法和基于向量投影的支持向量机增量算法相比,基于Fisher向量投影的支持向量机增量算法的训练速度分别提升了86%和33%左右。该方法可用于大规模样本集的分类识别问题。  相似文献   

5.
针对高维相关数据发布的隐私保护问题,本文提出2种隐私保护数据发布方法,解决高维相关数据发布时重复加噪导致的发布数据效用过低问题。基于概率主成分分析模型的隐私数据发布方法,及基于概率主成分分析和差分隐私的数据发布方法,利用主成分分析对高维数据降维,在低维数据中加入拉普拉斯噪声,然后再由概率主成分分析的生成模型生成数据集发布,使得发布的数据集满足差分隐私。经过分析与验证,当选取恰当的主成分个数时,2个真实数据集上的分类准确率较同类方法提高2%~5%。本文方法在支持向量机分类准确率方面可以保持良好的数据效用。  相似文献   

6.
稀疏最小二乘支持向量机   总被引:4,自引:0,他引:4  
针对大规模数据集的回归和分类问题,改进了最小二乘支持向量机.以再生核希尔伯特空间中的线性分析为基础,把样本集映射到再生空间中,然后张成再生空间的一个线性子空间,并求出这个子空间的基.利用基线性表示子空间中的其他元素,减小了求解矩阵的维数,通过求解规模相对较小的线性方程组完成对支持向量机的训练.采用该方法对较大规模的数据样本进行了回归和分类仿真试验,并与普通的最小二乘支持向量机进行比较.结果表明,采用该方法解决复杂非线性函数的回归和分类问题,不但可以得到稀疏解,而且计算速度比普通最小二乘支持向量机提高了约20%.  相似文献   

7.
针对给定的大规模数据集的回归估计问题,提出基于支持向量机的模糊回归估计方法.该方法把复杂的数据集看作多个群体的混合,每个群体采用单一的回归模型进行描述,使得大规模数据集的回归估计问题变成了一个多模型估计问题.在此基础上把支持向量机与模糊C聚类结合起来得到基于支持向量机的模糊回归模型,并给出了实现该模型回归估计的算法.该方法对大规模的数据样本进行模糊C聚类,并回归估计各聚类的数据样本.数值仿真结果表明,该方法在聚类数据样本的同时能实现多个模型的回归估计,而且模糊隶属度的初始化影响要小于其他的模糊回归估计方法.  相似文献   

8.
为进一步改善局部支持向量机的分类效率和分类精度,提出一种改进的局部支持向量机算法。该算法对每类训练样本分别进行聚类,使用聚类生成的样本中心点集代替样本,使用改进的k最近邻算法选取测试样本的k个近邻。分别在UCI数据集和自建树皮图像数据集上对本研究算法的有效性进行测试。实验结果表明,本研究提出的算法在分类精度和效率上具有一定的优势。  相似文献   

9.
一种改进的加权边界调节支持向量机算法   总被引:1,自引:0,他引:1  
为了改进现有支持向量机所确定的边界抗干扰能力差、对噪声数据敏感等问题,减少野点数据对形成支持向量机边界存在的影响,根据各个样本在整个训练样本集中的重要性不同,将各个训练样本的重要性程度值作为权值赋予边界值上,提出了一种基于加权边界调节的支持向量机算法.通过对标准UCI数据集和人工数据集上的仿真实验表明,基于加权边界调节的支持向量机具有较好的野点免疫能力,具有更高的分类精度、更少的支持向量和更好的推广能力.  相似文献   

10.
将K近邻分类法和支持向量机分类法结合起来,给出一种电信客户流失预测方法,即对边界样本采用加权K近邻分类,而对非边界样本采用改进的支持向量机分类。在公开不平衡数据集和电信数据集上的实验可验证所给方法有效,且能提高少数类的检测精度和总体评价指标。  相似文献   

11.
随着人们对隐私权的越来越重视,隐私保护数据挖掘成为当前研究热点.分类算法作为一个重要的数据挖掘方法被应用到各个领域,其中支持向量机(SVM)是分类算法中一个重要方法.并且数据的隐私性和安全性是人们关注的重点.本文对SSP协议进行扩展提出了一个基于垂直分布数据的隐私支持向量机算法,这个算法具有更高的效率和更好的安全性.  相似文献   

12.
13.
用遗传算法求SVM的最优超平面   总被引:2,自引:0,他引:2  
支持向量机(SVM)是解决小样本学习问题的有力工具,其关键是如何得到判别样本类别的最优超平面。受约束条件的限制,最优超平面的求解比较繁琐。遗传算法具有全局搜索最优解的特点,是求最优值问题的非常有效的方法。由此,利用遗传算法得到了一个直接求最优超平面近似解的方法,该方法不同于传统的二次规划方法。  相似文献   

14.
为了扩展支持向量机在大规模数据集和成批出现数据领域的应用,提出了一种基于支持向量机的增量式学习算法.利用标准的支持向量机算法训练得到初始的目标概念,通过增量式步骤不断更新初始的目标概念.更新模型是求解一个与标准支持向量机具有类似的数学形式的凸二次规划问题.证明了在可分情况下,如果新增加的样本不是位于边界区,那么增量式过程既不会改变分类平面也不会改变分类平面的表达.与现有的增量式支持向量机算法相比,该算法无需额外计算就可实现增量式的逆过程并且训练时间与增量式步骤数成反比.实验结果表明,该算法满足稳定性、能够不断改进性能以及性能回复三个准则.  相似文献   

15.
在短期风速预测方面支持向量机已被广泛应用并取得较好的效果. 然而, 随着应用的深入, 其逐渐暴露出两大问题: 一, 对噪声较为敏感; 二, 未能充分利用样本已有信息. 为进一步提高支持向量机的泛化能力, 该文提出模糊流形支持向量机FMSVM. 该方法引入模糊技术, 保证不同样本区别对待, 减少或消除噪声的影响; 充分利用流形判别分析的性质, 进一步改进支持向量机, 在分类决策时同时考虑样本的边界信息、分布特征以及局部流形结构. 通过某风场风速数据集上的比较实验验证该方法的有效性.  相似文献   

16.
为了解决现有维数约简算法受样本分布影响较大、不支持小样本学习等问题,在分析线性鉴别分析(LDA)中最优鉴别向量与支持向量机(SVM)中分类超平面法向量之间关系的基础上,基于统计不相关最优鉴别向量集优于正交最优鉴别向量集的事实,提出了通过对改进的SVM的二次优化问题进行递归求解来获取具有统计不相关性的最优边界鉴别向量集的算法,并使用核方法将其推广到可以解决非线性特征抽取问题.结果表明:在采用相同参数并使用k-最近邻分类器进行训练和测试的情况下,提出的算法对实际数据集Waveform,Heart,Diabetis的分类精度均高于SVM和RSVM,不会出现当抽取超过最优维数时随着抽取维数的增加分类精度反而降低的现象,体现了本算法在抽取不相关特征向量方面的有效性.  相似文献   

17.
基于支持向量机和云模型的网络健康状态评估   总被引:1,自引:0,他引:1  
分析了支持向量机分类方法的几何意义,结合健康评估问题的定义提出了一种基于支持向量机的网络健康评估方法.将健康评估转化为分类问题,以点到健康分类边界的距离为评估参数从整体上评价网络健康状况,降低了主观因素对网络评估的影响.采用云模型实现了健康度与评语域之间的不确定性映射,更符合评估的实际情况.基于opnet的仿真实验结果表明了该方法的可行性.  相似文献   

18.
分析了传统的支持向量分类机对不平衡数据集的影响,并提出了一种调整分离超平面偏移的方法一平均距离比MDR法.首先分别计算正、负类的支持向量到分离超平面距离的平均值,让这个平均值之比等于两类样本数的反比,从而得到偏移b*的值.实验表明,对于不平衡数据集问题,该方法比标准SVM具有更好的效果.  相似文献   

19.
为解决图像分类任务中词袋(Bag-of-Words)模型分类算法单一局部描述子信息缺失、特征量化误差较大、图像特征表现力不足等问题,提出一种基于多描述子分层特征学习的图像分类方法.结合尺度不变特征变换(SIFT)与形状核描述子(KDES-S)进行局部特征提取,并构建分层特征学习结构来减少编码过程中的量化误差,最后将图像特征分层归一化后进行线性组合并利用线性支持向量机(SVM)进行训练和分类.在Caltech-101、Caltech-256、Scene-15数据库上进行实验,结果表明:相比其他图像分类方法,本文方法在分类准确率上具有显著提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号