首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
高光谱遥感影像具有高维非线性、数据冗余多、训练样本难以获得等特点。在线性最小噪声分离变换MNF(Minimum Noise Fraction)的基础上,引入核方法,提出核最小噪声分离变换KMNF(Kernel Minimum Noise Fraction)高光谱遥感影像非线性特征提取方法。在KMNF特征提取后的影像上利用多类SVM进行高光谱影像分类,分析数据维数、样本个数对分类结果的影响,并与传统的最小距离分类方法进行对比。发现最小距离分类法存在维数灾难现象,当达到一定的特征维数之后,多类SVM分类方法受维数影响较小,具有一定的抗噪声能力,在一定程度上避免了维数灾难现象;利用多类SVM进行分类时,随着样本数目的减少,合理设置有关参数,高光谱图像的分类能够维持在较高精度;而传统的最小距离分类法当样本数量较小时,效果很差,这说明了SVM小样本分类的优势。  相似文献   

2.
针对支持向量机SVM分类效率低下的问题,提出一种基于层次K-均值聚类的支持向量机HKSVM(Hierarchical K-means SVM)学习模型。该方法首先对每类样本分别进行K-均值聚类,计算每类中心并训练SVM,得到初始分类器;然后根据超平面与聚类结果的关系,将聚类所得结果划分为活动类集和静止类集,并对超平面附近的活动类集进行深层聚类,以得到更小的类别同时计算类中心来训练新的SVM模型,并校正分类超平面,如此循环往复,直到得到较为精确的分类器为止。采用基于层次K-均值聚类的SVM模型,通过对活动类集进行不断地深层次聚类,从而在分类超平面附近得到较多样本点,而在距离超平面较远处则取少量训练样本,以有效压缩训练集规模,在保持SVM训练精度的同时大幅度提高其学习效率。标准数据集上的实验结果表明,HKSVM方法在大规模数据集上同时得到了较高的分类效率和测试精度。  相似文献   

3.
针对SVM方法在大样本情况下学习和分类速度慢的问题,提出了大样本情况下的一种新的SVM迭代训练算法。该算法利用K均值聚类算法对训练样本集进行压缩,将聚类中心作为初始训练样本集,减少了样本间的冗余,提高了学习速度。同时为了保证学习的精度,采用往初始训练样本集中加入边界样本和错分样本的策略来更新训练样本集,迭代训练直到错分样本数目不变为止。该文提出的基于K均值聚类的SVM迭代算法能在保持学习精度的同时,减小训练样本集及决策函数的支持向量集的规模,从而提高学习和分类的速度。  相似文献   

4.
基于基因表达谱提出了一种依据类加权Bhattacharyya距离提取特征基因并使用人工神经网络(ANN)进行肿瘤亚型识别的方法。分析了儿童小圆蓝细胞瘤(SRBCTs)的基因表达数据后,在训练样本集上计算出各个基因的类加权Bhattacharyya距离,并据此选择特征基因构造若干ANN模型,利用独立测试集验证其分类能力,且依据分类错误率最小的原则确定了含40个基因的特征基因组合。基于该特征基因组合的ANN模型不仅正确地识别了所有的患病样本的亚型,还能鉴别非患病样本。  相似文献   

5.
孙哲人  黄玉划  陈志远 《软件学报》2022,33(10):3700-3716
提出了一个基于多样性分类和距离回归的进化算法(DCDREA),以解决昂贵超多目标优化问题(Ma OPs).DCDREA采用随机森林(RF)作为全局分类代理模型,它把种群中所有解作为训练样本,并根据是否为最小相关解,把训练样本分类为正负样本,使模型学习到训练样本中含有的分类标准.全局分类代理模型主要用来筛选新产生的候选解,以得到一组有希望的候选解.此外,它采用Kriging作为局部回归代理模型,其选择种群中距离当前候选解最近的解作为训练样本,拟合训练样本与理想点的距离.然后,通过K-means方法把候选解划分为μ个簇,并从每个簇中选择一个用于真实评估的候选解.在实验部分,使用大规模3、4、6、8、10目标的DTLZ测试问题集,把DCDREA与目前流行的代理辅助进化算法进行对比实验.对于不同测试问题,每个算法独立运行20次,然后统计反向迭代距离(IGD)和算法运行时间.最后,使用秩和检验来分析结果.实验对比结果表明,DCDREA在大多数情况下表现更好.由此可见, DCDREA具有较好的有效性和可行性.  相似文献   

6.
训练样本选取对最小二乘支持向量机(LSSVM)的泛化能力有较大影响,为了提高网络流量预测精度,提出一种最优训练样本子集的LSSVM网络流量预测模型(IFCM-LSSVM)。首先采用密度方法识别和剔除网络流量数据中的孤立点,消除孤立点对模糊均值聚类(FCM)聚类结果的不利影响;然后采用FCM算法对处理后网络流量数据进行聚类,并根据预测点输入向量与聚类中心的最小距离选择最优训练集,加强训练集规律性,减少LSSVM对训练集的依赖性;最后采用非线性预测能力强的LSSVM对训练集进行学习建立网络流量预测模型,并采用仿真实验对模型性能测试。仿真结果表明,相对于对比模型,IFCM-LSSVM提高了网络流量的预测精度,加快了模型的训练速度,预测结果更加稳定、可靠。  相似文献   

7.
为减少高光谱遥感图像光谱空间冗余,降低后续处理的计算复杂度,提出一种基于最大最小距离的高光谱图像波段选择算法。首先计算波段标准差,选定标准差最大的波段作为初始中心;然后使用最大最小距离算法得到相对距离较远的聚类中心,对波段进行聚类;最后使用K中心点算法更新聚类中心。实验仿真结果表明:通过基于最大最小距离算法选择的波段,能够选出同时满足信息量大、相关性小的要求的波段子集,并将获得的波段组合用于高光谱图像分类时,可以得到较好的分类精度。  相似文献   

8.
分类数和初始聚类中心的选取对红外图像的分割结果有较大的影响。传统的模糊C均值算法的分类数和聚类中心往往设定为经验值。为获得最佳的分类数,提出采用轮廓指标确定出较理想的分类数。针对传统的模糊C均值聚类算法对初始聚类中心比较敏感的问题,提出了基于直方图灰度值的最小最大距离法来确定初始聚类中心。实验结果表明该方法有效可行。  相似文献   

9.
基于目标分解与支持向量机的极化SAR图像分类研究   总被引:1,自引:0,他引:1       下载免费PDF全文
为了有效地对极化SAR图像进行分类,基于目标分解和支持向量机,提出了一种极化SAR图像非监督分类法。该方法首先利用目标分解理论获得极化熵和平均散射角,并在熵-平均散射角平面对图像进行初分类,以确定类中心;然后利用Wishart分布定义的距离函数寻找训练样本,同时选择一定的极化参数组成特征矢量,并利用训练样本和特征矢量训练支持向量机;最后用训练好的分类器对极化SAR图像进行分类。通过对ESAR图像进行分类,比较了多种参数组合的分类结果,并与Wishart方法进行了比较,结果表明,该方法特征选择非常灵活,不仅结果类内离散度更小,且不需要太多的迭代次数。  相似文献   

10.
训练样本量、辅助数据和分类法是影响土地利用/覆盖分类精度的3个主要因素,通过找到这3个因素的最佳组合方式以提高分类精度,分别在25%、50%、75%、100%样本量下,加入NDVI、DEM和纹理均值特征作为辅助数据,比较了分类回归树、支持向量机、最大似然法3种分类法的效果,探讨了训练样本、辅助数据以及分类技术对土地利用/覆盖分类精度的影响。结果表明:支持向量机总体分类精度较高,在相同样本量和没有有效辅助数据的情况下,SVM可以获得最佳的分类结果,总体分类精度在85%以上;在进行分类时,加入NDVI和纹理均值特征使分类回归树分类精度提高了2.82%,说明该方法对有效辅助数据的加入较为敏感;在获取的训练样本集有限而可获取有效的辅助数据时,应优先考虑利用分类回归树进行土地利用/覆盖分类。  相似文献   

11.
针对基于数据的涡轴发动机故障检测算法的分类性能较差、鲁棒性不强的问题,提出一种改进的加权一类支持向量机(WOCSVM)算法——基于局部密度的WOCSVM (LD-WOCSVM)算法。首先,对于每个训练样本,选取以该样本为中心,以全体训练样本中心到距离最远样本之间马氏距离的百分之二为半径的球体内所包含的k个近邻样本;其次,以该样本到选定的k个训练样本的中心的距离大小来评估该样本为故障样本的可能性,并以此为依据,使用经过归一化的距离来计算对应样本的权重。针对目前算法不能很好地反映样本分布特点的问题,提出了一种基于快速聚类的权重计算方法并将其命名为FCLD-WOCSVM。该算法通过求取每个训练样本的局部密度和该样本到高局部密度的距离两个参数,来确定该样本的分布位置,并利用求得的两个参数来计算该样本的权重。两种算法都是通过对可能的故障样本分配较小的权重来增强算法的分类性能。为了验证算法的有效性,分别在4个UCI数据集和T700涡轴发动机上进行仿真实验。实验结果表明,与自适应WOCSVM (A-WOCSVM)算法相比,LD-WOCSVM算法在AUC值上提高了0.5%,FCLD-WOCSVM算法在G-mean上提高了12.1%,两种算法可以作为涡轴发动机故障检测候选算法。  相似文献   

12.
为了提高网络流量的预测准确性,针对训练样本选取问题,提出一种训练样本选择的最小二乘支持向量机网络流量预测模型(FCM-LSSVM)。采用模糊均值聚类算法对网络充量数据进行了聚类分析,消除其中的孤立样本点,构建最小二乘支持向量机的训练集,然后将训练集输入到最小二乘支持向量机进行了学习,并采用人工蜂群算法对模型参数进行了优化,最后建立建立网络流量预测模型,并采用仿真实验对模型性能测试。仿真结果表明,相对于其他网络流量预测模型,FCM-LSSVM不仅提高了网络流量的预测精度,而且建模速度得以提高,获得了更加理想的网强流量预测结果。  相似文献   

13.
构造性覆盖算法(constructive covering algorithm,CCA)三支决策模型在学习过程中根据样本分布特征,自动产生正域、负域和边界域。该模型为边界域样本处理问题提供了新的思路。重点讨论了基于CCA的三支决策的边界域样本处理问题。对边界域样本处理提出了两种决策方案:一种为处理全部的边界域样本,给出了距中心最近原则、距边界最近原则、万有引力原则3种方法;另一种为处理部分的边界域样本,即只对满足一定条件的边界域样本作进一步的划分,这样使不满足条件的边界域样本仍保留在边界域,提高了边界域样本处理的正确率。用十字交叉法在5组数据集上对这两种决策方案进行了对比,实验结果表明,处理部分边界域样本时正确率更高,效果更好。  相似文献   

14.
张志平  汪庆淼 《计算机工程》2010,36(23):139-141,145
根据隐马尔可夫模型(HMM)适用于处理连续动态序列信号、支持向量机(SVM)与K近邻分类器(KNN)擅长模式分类的特点,设计一种(HMM+KNN)+SVM的混合分类器。利用HMM与KNN对测试样本进行判决。当判决结果相同时,直接输出判决结果,否则引入SVM对测试样本进行再判决。实验结果表明,该方法所确定的分类器优于单一的分类器判决,能有效实现表情识别。  相似文献   

15.
针对传统支持向量机(SVM)多分类一对多算法存在的运算量大、耗时长、数据偏斜以及对最优超平面附近点分类易出错问题,提出了一种改进方法。将数据空间分为密集区和稀疏区,各类中密集点归于密集区,其余归于稀疏区。将每类中密集点连同它附近的点用于训练得到相应的SVM分类器。在测试阶段,对密集区的待测样本用传统的一对多判别准则来做类别预测;对稀疏区的待测样本则采用K近邻(KNN)算法。数值实验结果表明,改进的算法在耗时和分类精度上都优于原算法,对解决一对多算法存在的问题有较好的成效。  相似文献   

16.
针对伪近邻分类算法(LMPNN)对异常点和噪声点仍然敏感的问题,提出了一种基于双向选择的伪近邻算法(BS-PNN)。利用邻近性度量选取[k]个最近邻,让测试样本和近邻样本通过互近邻定义进行双向选择;通过计算每类中互近邻的个数及其局部均值的加权距离,从而得到测试样本到伪近邻的欧氏距离;利用改进的类可信度作为投票度量方式,对测试样本进行分类。BS-PNN算法在处理复杂的分类任务时,具有能够准确识别噪声点,降低近邻个数[k]的敏感性,提高分类精度等优势。在UCI和KEEL的15个实际数据集上进行仿真实验,并与KNN、WKNN、LMKNN、PNN、LMPNN、DNN算法以及P-KNN算法进行比较,实验结果表明,基于双向选择的伪近邻算法的分类性能明显优于其他几种近邻分类算法。  相似文献   

17.
拓守恒 《系统仿真技术》2010,6(3):202-208,240
针对训练子集随机性强、规模大、算法时空复杂度高等问题,提出了基于量子微粒群的支持向量机(QPSO-SVM)核函数集成学习算法。该方法首先采用K-Means算法对训练样本进行聚类分析,然后根据其聚类分布选择少量具有代表性的样本,并通过基于量子行为的粒子群算法来训练单个支持向量机(SVM),最后通过贝叶斯投票方法得到集成的SVM分类学习器。实验表明该方法在非线性高复杂度的数据分类中对分类精度有较大提高。  相似文献   

18.
针对行人再识别中相似性度量误差引起的识别效果较差的问题,提出多置信度重排序的行人再识别算法,通过对再排序过程中测试样本的置信度进行评估,提高行人再识别的准确性.首先对目标样本及测试样本依据深度学习网络ResNet50获得描述特征.然后对目标样本与测试样本之间的相似性进行初始排序,对相似排序得到的样本构建相似样本集合,获得每个类别的聚类中心和样本距离聚类中心的最小、最大、均值距离,设置3个置信度不同的置信区间.最后使用Jaccard距离对目标样本与测试样本的相似度进行重排序.在标准测试数据集上的实验表明文中算法的有效性.  相似文献   

19.
传统的支持向量机相似性学习算法在构造样本对时,会考虑所有的原始训练样本,致使样本对空间和原样本空间呈平方关系,而过多的训练样本对会降低训练速度。为此,提出一种改进的支持向量机相似性学习算法,并应用到人脸识别中。引入二元样本对方法构造样本对,采用K近邻算法减少不相似样本对的生成,从而加快支持向量机的训练速度,同时使用随机降维方法来降低人脸数据的维数。实验结果表明,与基于差空间样本对和差绝对值样本对的算法相比,该算法可获得更高的识别率。  相似文献   

20.
基于小样本学习的垃圾邮件过滤方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对客户端垃圾邮件过滤器难以获取足够训练样本的问题,提出一种基于小样本学习的垃圾邮件过滤方法,利用容易获取的未标记样本提高垃圾邮件过滤的性能。该方法使用已标记的小样本邮件实例集训练一个初始Na?ve Bayes分类器,以此标注未标记邮件,再使用所有数据训练新的分类器,利用EM算法进行迭代直至收敛。实验结果证明,当给定5个~20个已标记小样本训练邮件时,该方法可有效提高垃圾邮件过滤性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号