首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
大数据应用带来高维数据急剧增加,数据降维已成为重要问题.特征选择降维方法已广泛应用于模式识别领域,近年来提出了许多基于流形学习的特征选择方法,然而这类方法往往容易受到各种噪声影响.对此,本文提出一种联合低秩表示和图嵌入的高效无监督特征选择方法(JLRRGE).通过低秩表示寻找数据在低秩子空间下的表示,降低噪声的影响从而提高算法的鲁棒性,并通过自适应图嵌入方法,使选择特征保持原有的局部关系.实验结果表明,本文提出算法的分类准确率优于其他对比算法.  相似文献   

2.
数据降维是从高维数据中挖掘有效信息的必要步骤。传统的主成分分析(PCA)算法应用于超高维稀疏数据降维时,存在着无法将所有数据特征一次性读入内存以进行分析计算的问题,而之后提出的分块处理PCA算法由于耗时太长,并不能满足实际需求。本文引入信息熵的思想对PCA算法进行改进,提出E-PCA算法,先利用信息熵对数据进行特征筛选,剔除大部分无用特征,再使用PCA算法对处理后的超高维稀疏数据进行降维。通过实验结果表明,在保留相同比例原数据信息的情况下,本文提出的基于信息熵的E-PCA算法在内存占用、运行时间以及降维结果都优于分块处理PCA算法。  相似文献   

3.
垃圾网页检测存在数据不平衡、特征空间维度较高的问题,为此,提出一种基于随机混合采样和遗传算法的集成分类算法.首先,使用随机混合采样技术,通过随机抽样,减少多数类样本数量,用少数类样本合成过采样技术方法生成少数类样本,获得多个平衡的训练数据子集;然后使用改进的遗传算法对训练数据集进行降维,得到多个具有最优特征的训练数据子集;使用极端梯度算法(XGBoost)作为分类器,训练多个平衡数据子集,用简单投票法对多个分类器进行集成,得到新的分类器;最后对测试集进行预测,得到最终预测结果.实验结果表明,提出算法的分类结果与XGBoost的结果相比,准确率提高了约19.25%,且减少了建立学习模型的时间,提高了分类性能,是一种较好的分类算法.  相似文献   

4.
针对基于局部保持投影(locality preserving projection,LPP)的哈希用于图像检索造成图像表征力不强、检索效率低下的问题,融合LPP及主成分分析(principal component analysis,PCA)技术,提出一种随机旋转局部保持哈希的图像检索算法。首先对样本进行PCA降维,对PCA变换矩阵进行随机旋转形成PCA降维矩阵,将原始样本在降维矩阵上进行投影,得到PCA降维样本。为充分利用样本间的相似性结构,对PCA降维样本进行LPP映射,并引入随机矩阵对特征向量进行偏移构造最终编码投影矩阵。再将原始样本投影到编码投影矩阵,得到最终的降维样本;最后对其进行哈希编码,得到有效的二进制编码用于图像检索。算法充分考虑样本间的全局和局部相似性结构,体现了样本间所蕴含的局部和全局信息,把随机旋转应用于PCA降维矩阵,减少了编码之间的量化误差,提高了图像特征的识别能力。分别在3个人脸数据集上进行性能测试实验,并与相关方法进行比较,得到了较好的效果。实验结果表明该方法是有效的。  相似文献   

5.
为更好地处理图像小样本问题,且克服二维局部保持投影(2DLPP)算法只能保持数据局部性质的缺陷,通过结合二维主成分分析(2DPCA)和二维线性鉴别分析(2DLDA)的算法特性,提出了一种改进的双向二维局部保持投影的人脸识别算法。首先,引入样本类别信息改进权重矩阵,增强2DLPP算法对样本变化的鲁棒性;其次,提出改进2DLPP+2DPCA、2DLPP+2DLDA两种融合算法并分别用于输入样本图像数据的行、列方向特征提取。在特征选择后得到行、列方向上的最优投影;最后,通过对样本数据进行行、列方向投影,利用最近邻分类器对样本数据进行分类并获得在给定数据集上的识别结果。在人脸数据集ORL、YALE和AR上的实验结果表明,该算法在人脸识别性能上总体优于2DPCA、2DLDA、2DLPP、(2D)2PCA、(2D)2LDA、(2D)2PCALDA和(2D)2LPP-PCA等算法。  相似文献   

6.
针对不平衡数据中特征维数高、标记样本缺乏问题,提出一种基于遗传算法和BiasedSVM的不平衡数据半监督特征选择算法。该方法首先利用初始的标记样本集训练处理不平衡数据的Biased-SVM模型,然后用训练好的Biased-SVM模型为未标记样本加上标签,再把新标记样本加入到初始标记样本集中,得到新标记样本集,最后采用基于遗传算法的不平衡数据特征选择方法选出最优的特征子集。实验结果表明,所提方法在不同的标记样本率下均具有较高的平均特征子集缩减率和平均小类识别率。  相似文献   

7.
基于仿射传播聚类的富模型降维方法   总被引:1,自引:0,他引:1  
富模型的提出为HUGO隐写算法的分析提供了新的思路,但是富模型特征维数高,冗余大,容易造成维数灾难问题;本文通过分析富模型特征结构,利用非线性距离定义特征距离,使用仿射聚类方法和图的谱理论,确定特征的聚类中心,将聚类中心所对应的特征作为新特征,使用Fisher集成分类器进行隐写分析。实验结果表明,经过该降维方法处理的SRM(空域富模型)在特征维数降低到8000维时,对于S-UNIWARD、WOW、HUGO隐写算法有着较低的检测错误率,最大降幅达到43.1%  相似文献   

8.
提出了基于GPS坐标解算实现星地激光通信捕获、跟踪和对准(ATP)初始捕获的方法。星地激光通信信标光跟踪系统通过对地面GPS坐标和卫星坐标的解算,得到地面光学天线的方位角和俯仰角,光学天线根据角度旋转对准信标光,从而将信标光引入粗跟踪CCD的视场。给出了GPS坐标解算算法和信标光方向角度随卫星坐标变化的仿真曲线。用二维电机进行了地面转台的捕获实验,对实验数据进行了捕获精度的分析,结果表明,通过GPS坐标解算能够快速地实现信标光的初始捕获。  相似文献   

9.
针对单一故障检测算法难以学习到数据样本全部特征的问题,提出基于双层混合集成的无监督自动驾驶汽车故障检测方法。使用非全连接的自动编码器作为基学习器构建第1层同质集成框架——集成自动编码器,分析和选择包含集成自动编码器、一类支持向量机、孤立森林和局部离群因子的基学习器构建第2层异质多模型集成框架,学习自动驾驶汽车正常传感器数据特征;提出基于自动编码器的投票集成方法,实现基学习器特征的降维和编码融合;通过sigmoid函数映射计算故障概率并对数据是否故障进行判断。试验结果表明,提出的双层混合集成故障检测方法性能优于基学习器算法,F1指标提高了9%~40%,G指标提高了2%~28%,该故障检测方法可有效实现自动驾驶汽车故障检测。  相似文献   

10.
水下目标识别中训练样本集含有冗余样本、噪声样本及无关样本,且特征提取、特征选择和决策系统设计过程分离而导致系统识别性能的下降,为此提出了基于加权最近邻收缩样本选择的SVM集成算法(SVME-WRNN)和基于加权免疫克隆样本选择的SVM集成算法(SVME-WICISA)。这2种集成方法通过样本选择来构建精度高、差异大的子分类器,并将其集成。利用4类水下目标实测数据进行了分类仿真实验。实验结果表明:SVME-WRNN算法和SVME-WICISA算法与SVME算法(无样本选择)相比较,在识别率相当的情况下,大幅度地降低了训练样本数目,得到的综合分类器具有良好的分类精度。  相似文献   

11.
基于LS-SVM与模糊补准则的特征选择方法   总被引:3,自引:3,他引:0  
针对传统特征选择算法采用单一度量的方式难以兼顾泛化性能和降维性能的不足,提出新的特征选择算法(least squares support vector machines and fuzzy supplementary criterion, LS-SVM-FSC)。通过核化的最小二乘支持向量机(least squares support vector machines, LS-SVM)对每个特征的样本进行分类,使用新的模糊隶属度函数获得每个样本对其所属类的模糊隶属度,使用模糊补准则选择具有最小冗余最大相关的特征子集。试验表明:与其他10个特征选择方法与7个隶属度决定方法相比,所提算法在9个数据集上都具有很高的分类准确率和很强的降维性能,且在高维数据集中的学习速度依然很快。  相似文献   

12.
SVM算法复杂度与样本维数无关,具有的泛化能力强、分类精度高的特点,而LLE是有效的非线性降维方法,本文利用支持向量机(SVM)算法对局域线性嵌入(LLE)算法进行改进,有效地解决了基于内容的图像检索中的高维特征向量的降维问题,实验表明具有较高的查全率和查准率。  相似文献   

13.
在开放动态环境下分类学习的任务中,数据通常存在类别长尾分布的特点,且数据标记空间存在层次化结构关系以及动态性.针对实际任务中不同的需求,许多特征选择算法被提出,但是这些已有的特征选择算法忽略数据的长尾分布特点和特征空间的不确定性.针对上述问题,文中提出基于邻域粗糙集的长尾分布数据在线流特征选择算法.借助邻域粗糙集模型,并考虑邻域内样本间的关系后,定义了自适应邻域关系,设计基于稀有类样本重要性的依赖度计算公式.同时,利用层次结构降低类别不平衡性,提出在线冗余度分析和在线重要度分析两种在线特征评价指标,用于选出具有高可分离性和强区分性的特征子集.实验结果表明所提算法优于其它先进算法.  相似文献   

14.
高维小样本数据作为数据挖掘的难点,用传统的随机森林算法进行特征选择时极易出现分类结果过拟合而导致的特征重要度排序稳定性差、精度低等问题。针对随机森林在小样本数据降维过程中出现的难点,提出了一种基于小样本数据特征提取算法OTE-GWRFFS。基于生成对抗网络GAN进行样本扩充,避免传统随机森林在小样本分类过程中的过拟合现象;在数据扩充的基础上采用基于权重的最优树集合算法,减小生成数据分布误差对特征提取精度的影响,提升决策树集合的整体稳定性;采用单棵决策树的权重与特征重要性度量值加权平均得到特征重要性排序,从而解决了小样本数据特征选择过程中精度低稳定性差的问题。通过UCI数据集将所提算法与传统随机森林以及基于权重的随机森林算法进行实验对比,OTE-GWRFFS算法在处理高维小样本数据时具有更高的稳定性和精度。  相似文献   

15.
考虑了一种带有数据领域知识的降维问题。这里领域知识是指关于数据的一些额外监督信息,如类别标号以及比标号弱的样本间相似性和不相似性约束等。其中,约束可以从标号中产生,但反过来从约束中却得不到标号信息,因而约束比标号更一般。另外,在图像检索等实际应用中,约束比标号更容易获取。鉴于此,本文主要研究基于约束的降维问题。提出了一种有效利用约束进行降维的约束保持嵌入算法(constraint preserving embedding, COPE),将其纳入到图嵌入统一框架之中并指出与同类方法的关系。进一步,通过引入无标记样本提出了半监督COPE算法;提出核COPE以揭示数据中的非线性结构。最后,在人脸识别、图像检索及半监督聚类等一系列实验中的结果验证了算法的有效性。  相似文献   

16.
WSN中基于FCM算法的多目标跟踪数据融合   总被引:2,自引:0,他引:2  
基于LEACH(低功耗自适应聚类路由算法)路由协议, 研究了多目标跟踪的数据融合方法. 在基于模糊聚类(FCM)算法进行数据融合设计时,发 现算法存在错误跟踪、丢失新目标和重复跟踪的问题. 针对这些问题产生的原因进行了详细 的分析,并提出了改进,使FCM算法更好地应用于传感器网络.  相似文献   

17.
边界Fisher分析(MFA)是一种有效的特征抽取方法,但在人脸识别的应用中会遭遇小样本问题。基于此,提出一种利用零空间法求解MFA优化准则的算法。该算法通过在MFA的类内散度矩阵的零空间中最大化MFA类问离散度得到最优投影向量,从而避免MFA方法所遇到的小样本问题,同时也保留了包含在类内散度矩阵零空间中的鉴别信息。在标准人脸库上的识别实验结果表明,该算法的识别率高于LDA和MFA,并且较容易选择其最优低维特征空间的维数。  相似文献   

18.
基于LEACH(低功耗自适应聚类路由算法)路由协议, 研究了多目标跟踪的数据融合方法. 在基于模糊聚类(FCM)算法进行数据融合设计时,发 现算法存在错误跟踪、丢失新目标和重复跟踪的问题. 针对这些问题产生的原因进行了详细 的分析,并提出了改进,使FCM算法更好地应用于传感器网络.  相似文献   

19.
在大数据时代,数据的标签数量急剧增加,且标签集之间往往存在层次结构,利用层次结构进行大规模分类学习可有效解决维数灾难、类别不均衡问题,是近年来的研究热点.模糊粗糙集作为处理不确定性信息的有效工具,对于层次结构的描述有着特别的优势,本文给出了一种基于样本对选择的分层特征选择方法.通过将层次结构融入到目标概念的上、下近似之中,给出了一种新的模糊粗糙集模型,并研究了其详细性质,基于此,设计了一种基于样本对选择的特征选择算法,实验结果表明,本文所提出的算法在效率和准确性方面优于平面算法,从而为基于粒计算的分层特征选择提供了一种可能的框架.  相似文献   

20.
基于特征筛选的云分类器   总被引:3,自引:0,他引:3  
高维且不独立的样本特征集使分类的准确性降低,笔者提出一种根据样本集特征权值进行特征选择的方法。根据特征间的相似性度量函数计算特征的权重,并根据权重去除重要性差的特征,用于解决高维样本集的特征降维问题,特征选择结果与主成份分析结果一致。建立基于保留特征加权的云分类模型,应用于iris数据集和复杂矿石图像的分类,效果良好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号