首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
基于样本投影分布的平衡不平衡数据集分类*   总被引:2,自引:0,他引:2  
提出一种平衡不平衡数据集统一分类方法,首先得到训练样本基于支持向量机(SVM)超平面法线方向上的投影;再借助支持向量数据描述(SVDD)对训练样本投影分布进行描述;测试样本在此基础上实现分类。平衡或不平衡数据集都可采用相同的方法进行分类。实验表明该方法能够同时对平衡或不平衡数据集进行有效的分类。  相似文献   

2.
徐引玲 《计算机工程》2010,36(19):195-197
为提高支持向量域分类器(SVDC)的分类精度和鲁棒性,提出基于K近邻(KNN)和支持向量域描述(SVDD)的分类器KNN-SVDD (KSVDD)。该分类器对单类内部的样本采用SVDD的判别准则,对类交叉区域及描述边界外的样本采用KNN的判别准则。通过拒绝描述边界外的样本,KSVDD可应用于拒识判别。UCI数据集上的数值实验表明,KSVDD分类精度与支持向量机(SVM)相当且均比SVDC高,训练时间比SVM短,鲁棒性强,在拒识判别中有良好表现。  相似文献   

3.
针对支持向量数据描述(SVDD)单类分类方法运算复杂度高的缺点,提出一种启发式约减支持向量数据描述(HR-SVDD)方法。以启发的方式从原有训练集中筛选出部分样本构成约减训练集,对约减训练集进行二次规划解算,得到支持向量和决策边界。通过不同宽度系数高斯核SVDD特征的讨论,证明了HR-SVDD的有效性。人工数据集和真实数据集上的实验结果表明, HR-SVDD分类精度与传统支持向量数据描述相当,但具有更快的运算速度和更小的内存占用。  相似文献   

4.
为解决支持向量机(SVM)在处理无标签数据多类分类上的难题,提出了一种基于支持向量数据描述(SVDD)的无标签数据多类分类算法。该方法只需要建立一个分类模型就可以实现多类聚类分类。首先采用主成分分析作数据预处理,提取输入数据的统计特征值,得到主成分特征指标输入到SVDD分类器进行多类聚类分类。以珠三角地区物流中心城市分类评价为研究对象,实证结果表明,采用主成分分析降低了数据维度,有效浓缩了评估信息,SVDD分类器很好地区分了各中心城市,实现了多类分类的目的。  相似文献   

5.
数据描述只使用目标集训练样本获得关于目标集的描述,支持向量数据描述(SVDD)是一种有效的数据描述方法。样本错误加权的SVDD(WSVDD)推广了SVDD,对每个训练样本的错误赋予不同的权值,可以精细地控制训练样本对超球面边界的影响。用UCI机器学习数据集的两个数据和图标分类的实验验证了WSVDD的有效性。  相似文献   

6.
针对支持向量机分类器的行人检测方法采用欠采样方法,存在正负行人比例不平衡造成的准确率不高问题,结合欠采样和EasyEnsemble方法,提出一种聚合支持向量机(Ensemble SVM)分类器的行人检测方法。随机选择负样本作为初始训练样本,并将其划分为与正样本集均衡的多个子负样本集,构建平衡子训练集,线性组合成EasyEnsemble SVM分类器;利用该分类器对负样本进行分类判断,将误判样本作为难例样本,重新划分构建新的平衡子训练集,训练子分类器,结合EasyEnsemble SVM分类器,得到Ensemble SVM分类器行人检测方法。在INRIA行人数据集上的实验表明,该方法在检测速度和检测率上都优于经典的SVM行人检测算法。  相似文献   

7.
基于支持向量数据描述的分类方法研究   总被引:1,自引:1,他引:1       下载免费PDF全文
针对单类数据的分类问题,提出一种基于支持向量数据描述(SVDD)的分类算法。该算法利用SVDD获得包含单类数据的最小球形边界,通过该边界对未知样本数据进行分类,同时采用可行方向方法求解边界优化中的二次规划问题,并在UCI机器学习数据集上将该算法与LS—SVM算法进行比较。实验结果表明,该算法不仅获得了更高的分类准确率,而且具有较低的运行时间。  相似文献   

8.
基于支持向量数据描述良好的分类性能,针对旋转机械故障诊断中故障样本获取的特点,提出了基于正负类样本的加权模糊支持向量数据描述多类分类器,不仅考虑了正类样本,而且也充分考虑了负类样本对分类结果的影响.利用模拟故障样本对系统进行了实验,结果表明提出的方法在系统中具有良好的分类能力.  相似文献   

9.
基于SVM(支持向量机)的SVDD(支持向量数据描述)分类算法存在计算复杂、分类准确率较低的缺陷, 针对股票数据非线性、高噪声的特点, 在传统的SVDD分类算法基础上, 模糊核超球快速分类算法(FCABFKH)通过合并法寻找超球集, 并依据最大隶属度原则构建分类器, 排除了离群点和超球集的重叠问题, 同时避免了复杂的二次规划, 具有分类速度快, 分类结果准确率高的特点。采用中国沪市上市公司数据验证该方法的有效性, 实验结果表明, 运用FCABFKH算法得到的组合回报率超过了市场基准。  相似文献   

10.
SVM在处理不平衡数据分类问题(class imbalance problem)时,其分类结果常倾向于多数类。为此,综合考虑类间不平衡和类内不平衡,提出一种基于聚类权重的分阶段支持向量机(WSVM)。预处理时,采用K均值算法得到多数类中各样本的权重。分类时,第一阶段根据权重选出多数类内各簇边界区域的与少数类数目相等的样本;第二阶段对选取的样本和少数类样本进行初始分类;第三阶段用多数类中未选取的样本对初始分类器进行优化调整,当满足停止条件时,得到最终分类器。通过对UCI数据集的大量实验表明,WSVM在少数类样本的识别率和分类器的整体性能上都优于传统分类算法。  相似文献   

11.
为了实现高分辨率遥感影像自动分类及进一步提高非监督分类的精度和效率,提出了一种训练样本自动选取的面向对象自动分类方法。首先利用均值漂移算法对遥感影像进行分割,获取同质性分割单元;然后对分割对象进行多特征(光谱特征、纹理特征和形状特征)提取,基于特征向量的几何距离进行训练样本自动选择,进而利用支持向量机分类器得到分类结果。实验研究表明,提出的面向对象自动分类算法不但可以利用影像对象丰富的特征信息,而且较好地避免了“椒盐现象”,使自动分类的精度和效率得到较大提升。  相似文献   

12.
付燕  鲜艳明 《计算机工程》2011,37(21):196-198
现有图像分类方法不能充分利用图像各单一特征之间的优势互补特性,提取的特征中存在大量冗余信息,从而导致图像分类精度不高。为此,提出一种基于多特征和改进支持向量机(SVM)集成的图像分类方法。该方法能提取全面描述图像内容的综合特征,采用主成分分析对所提取的特征进行变换,去除冗余信息,使用支持向量机的集成分类器RBaggSVM进行分类。仿真实验结果表明,与同类图像分类方法相比,该方法具有更高的图像分类精度和更快的分类速度。  相似文献   

13.
在主动学习的基础上,提出一种基于SLIC的高光谱遥感图像主动分类方法。首先提取图像纹理特征并与光谱特征融合,使用PCA对新数据进行降维,取前三个主成分构成假彩色图像,然后使用SLIC处理该图像获得超像素;接着随机抽取定量超像素作为初始训练样本,样本光谱信息为超像素样本中所有像素点的光谱信息均值,样本标签为超像素中出现次数最多的类别;然后通过主动学习得到SVM分类器;最后使用分类器对超像素分类得到其类别,并将超像素类别赋予其包含的像素点,从而达到高光谱遥感图像分类的目的。实验表明:该方法明显降低了主动学习过程的时间消耗,有效地提高了分类效果,其OA,AA和Kappa值显著优于未使用SLIC的主动学习方法。  相似文献   

14.
传统的支持向量机(Support Vector Machines,SVM)在面对大样本训练问题时,其样本数量会受到内存的限制。因此,提出一种基于级联SVM和分类器融合的人脸图像性别识别方法。级联SVM分类器可以通过设定阈值将识别难易程度不同的样本分成若干层次来进行训练;同时,在级联的每一层上,为了降低分类器在识别过程中受各种因素的影响,对不同特征维数下得到的最优分类器进行融合,通过融合减小误差,使中性的人脸样本有更明确的分类。在同一硬件条件下的实验结果表明,单层SVM最多只能训练7万样本,而四层级联SVM训练样本数可达12万以上,相应的识别率也从单层融合前的96.7%上升至四层融合后的99.1%。  相似文献   

15.
张志平  汪庆淼 《计算机工程》2010,36(23):139-141,145
根据隐马尔可夫模型(HMM)适用于处理连续动态序列信号、支持向量机(SVM)与K近邻分类器(KNN)擅长模式分类的特点,设计一种(HMM+KNN)+SVM的混合分类器。利用HMM与KNN对测试样本进行判决。当判决结果相同时,直接输出判决结果,否则引入SVM对测试样本进行再判决。实验结果表明,该方法所确定的分类器优于单一的分类器判决,能有效实现表情识别。  相似文献   

16.
成鹏  汪西莉 《计算机工程》2011,37(12):166-169
提出一种基于相似度融合的主动支持向量机算法,利用未标记样本和标记样本,结合支持向量机的方法实现主动学习.实验结果表明,该算法与普通主动学习的支持向量机相比,在保证分类器性能的情况下,可以减少标记样本的数目,抑制孤立样本对分类器的影响;在相同标记样本数目的情况下,该算法具有较高的分类精度.  相似文献   

17.
多数分类识别算法需要大量的已标注样本对分类模型进行训练。实际应用中,对大量样本进行标注枯燥耗时且代价昂贵,因此能够获得的已标注样本数量非常有限。将基于不确定性样本的主动学习和代表性样本的自学习方法引入到基于支持向量数据描述的分类模型中,提出了一种新的分类识别方法。通过主动学习去挖掘那些对当前分类模型最有价值的样本进行人工标注,并借助自学习方法进一步利用样本集中大量的未标注样本,使得在花费较小的标注代价下,能够获得良好的分类性能。在潜艇机械噪声源识别问题上的实验结果验证了该方法能有效降低样本标注代价。  相似文献   

18.
彩色多普勒超声是肾动脉狭窄的首选筛查工具,目前临床上主要依靠人工判别来诊断肾动脉狭窄,对操作者具有很强的依赖性。在肾动脉多普勒超声图像的基础上,通过提取肾动脉血流信号曲线、提取曲线特征,继而基于SVM构建分类器,对肾动脉血流信号曲线进行分类,取得了较高的分类精度,并与最大似然分类器进行了分类实验比较,在肾动脉狭窄的计算机辅助诊断方向进行了有意义的探索。  相似文献   

19.
针对传统支持向量机(SVM)多分类一对多算法存在的运算量大、耗时长、数据偏斜以及对最优超平面附近点分类易出错问题,提出了一种改进方法。将数据空间分为密集区和稀疏区,各类中密集点归于密集区,其余归于稀疏区。将每类中密集点连同它附近的点用于训练得到相应的SVM分类器。在测试阶段,对密集区的待测样本用传统的一对多判别准则来做类别预测;对稀疏区的待测样本则采用K近邻(KNN)算法。数值实验结果表明,改进的算法在耗时和分类精度上都优于原算法,对解决一对多算法存在的问题有较好的成效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号