首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
为降低高光谱数据的信息冗余以提高其分类精度,采用加权距离度量测度来衡量样本间的相似度并进而选择近邻样本,提出一种加权近邻保持嵌入数据降维(WNPE)算法.加权距离的主要思想为根据数据点附近样本点的分布来自适应地决定距离函数,由此可以避免基于标准欧氏距离的近邻选择方法产生的数据冗余现象,从而更好地提取信息量大的光谱波段.CUPRITE矿区高光谱数据上的实验结果表明,与目前具有代表性的稀疏降维和基于流形学习的降维算法对比,WNPE能够有效提高高光谱数据的分类总精度和Kappa系数,分别达到了90.97%和0.878 6.  相似文献   

2.
针对局部线性嵌入近邻选取和权重矩阵奇异的问题,提出一种自适应局部稀疏线性嵌入降维算法。采用稀疏度自适应匹配追踪求解权重矩阵,利用匹配追踪的残差迭代出近邻点的权重,避免权重矩阵求解过程中引起的奇异问题。通过样本重构的残差大小,自适应地选取合适的近邻点个数,对邻域进行二次选择,保留更多的样本结构信息。实验结果表明,该算法的分类正确率均高于其他降维算法,同时也缩短了运行时间。  相似文献   

3.
针对局部线性嵌入(LLE)降维算法中邻域参数的人工设定及其全局性的缺陷,研究了聚类和降维的内在联系,提出了邻域参数的自适应选取策略,构建了一种聚类和降维的自适应局部线性嵌入(ALLE)算法,为每个样本点设计最佳的近邻搜索空间,自适应选取邻近点计算权值重建矩阵,基于类信息重新定义了重构误差函数。实验表明,新算法更能体现出数学上流形概念的局部坐标化本质,对不相关数据、冗余数据和噪声数据具有良好的鲁棒性,在实际识别问题中体现出优越的性能。  相似文献   

4.
提出一种基于全局距离和类别信息的邻域保持嵌入算法。该方法在使用欧氏距离构造邻域图中,加入表征全局距离的全局因子和表示类别信息的函数项,全局因子可以使分布不均匀的样本变得平滑均匀,类别信息可以使同类样本点紧凑异类样本点疏离,通过提高所选邻近点的质量,优化数据的局部邻域,使降维后的数据具有更好的可分性。试验结果表明,该算法具有较高的准确率,优于传统的邻域保持嵌入算法。  相似文献   

5.
大数据应用带来高维数据急剧增加,数据降维已成为重要问题.特征选择降维方法已广泛应用于模式识别领域,近年来提出了许多基于流形学习的特征选择方法,然而这类方法往往容易受到各种噪声影响.对此,本文提出一种联合低秩表示和图嵌入的高效无监督特征选择方法(JLRRGE).通过低秩表示寻找数据在低秩子空间下的表示,降低噪声的影响从而提高算法的鲁棒性,并通过自适应图嵌入方法,使选择特征保持原有的局部关系.实验结果表明,本文提出算法的分类准确率优于其他对比算法.  相似文献   

6.
为验证优化的近邻保持算法(ONPE)在人脸识别中的应用价值,在NPE算法基础之上,ONPE对数据类内和数据类间的信息分别进行了优化,以使在低维重建时同一数据类间相互靠拢,不同数据类间相互分离。将ONPE算法应用于手工流形和Fery face人脸库进行实验。结果表明:在样本点不足且不连续的情况下,ONPE可以对手工流形有很好的降维效果,并且对人脸表情数据也有很好的识别分类效果。因此,优化的近邻保持嵌入算法具有较强的实用性和有效性。  相似文献   

7.
提出了一种结合流形学习方法与分类算法的基因微阵列数据分类模型,先用流形学习算法对基因微阵列数据进行降维处理,然后再对降维后的数据进行分类.在实验中将流形学习算法LLE、ISO-MAP、LE和LTSA与三种分类算法相结合,并与直接用高维数据进行分类的结果进行了比较,实验结果表明所提出的模型极大地提高了分类精度,同时也提高了分类算法的执行效率.  相似文献   

8.
潘思远    刘园奎    毛煜    林耀进   《南京师范大学学报》2023,(1):066-74
多标记学习可以同时处理与一组标记相关的数据,多标记学习的研究对于多义性对象的学习建模具有十分重要的意义. 与传统的单标记学习一样,数据的高维性是多标记学习的阻碍,因此数据降维是一项十分重要的工作,而特征选择是一种有效的数据降维技术. 提出了基于邻域近似误差率的多标记特征选择算法. 首先,在邻域粗糙集理论的基础上,引入实例的边界来对所有实例进行粒度化. 其次,基于邻域决策误差率提出了邻域近似误差率的策略来评价特征. 最后,在公开的数据集上进行了大量的实验,结果表明所提算法的有效性.  相似文献   

9.
多标记学习可以同时处理与一组标记相关的数据,多标记学习的研究对于多义性对象的学习建模具有十分重要的意义.与传统的单标记学习一样,数据的高维性是多标记学习的阻碍,因此数据降维是一项十分重要的工作,而特征选择是一种有效的数据降维技术.提出了基于邻域近似误差率的多标记特征选择算法.首先,在邻域粗糙集理论的基础上,引入实例的边界来对所有实例进行粒度化.其次,基于邻域决策误差率提出了邻域近似误差率的策略来评价特征.最后,在公开的数据集上进行了大量的实验,结果表明所提算法的有效性.  相似文献   

10.
针对海量工控网络数据样本分布不平衡导致态势要素提取精度低的问题,提出一种基于LOF-SMOTE平衡数据样本的方法.该方法首先用LOF算法在少数类样本点中筛选出分布较分散的样本点,再将筛选样本点通过SMOTE算法生成新的样本点,使各类别样本数据达到平衡.通过受限玻尔兹曼机(RB M)算法对工控数据的特征进行降维,应用随机森林算法实现工控网络态势要素的提取.通过控制单一变量的方法研究不同参数对最终结果的影响,并在N L_KDD数据集上进行了对比实验.  相似文献   

11.
为了提高并行节约算法的运算效率,需要运用合理的邻域选择策略和数据结构来降低算法的空间和时间复杂度。以车辆路径问题(vehicle routing problem, VRP)的数据规模和客户点的分布情况为切入点,综合考虑客户点的邻域范围与距离、规模、分布情况的关系,提出一种基于自适应思想的邻域选择策略,提高邻域选择的合理性,通过进一步优化数据存储结构降低存储空间。多组仿真测试证实,与其他邻域选择策略相比,自适应策略可以在保证运算质量的前提下,大幅度提高节约算法的运算速度,降低存储空间,且针对客户点较为集中的VRP具有明显的优势,其中rl5915表现最为突出,运算时间只需要其他邻域选择策略的50%左右。理论研究和实验结果证实自适应邻域选择策略可以有效提高节约算法的运算速率。  相似文献   

12.
一种基于矢量量化的高光谱遥感图像压缩算法   总被引:1,自引:0,他引:1  
压缩是高光谱遥感(hyperspectral remote sensing)图像的一个重要研究领域.文中充分考虑了高光谱遥感图像的谱间相关性较强而空间相关性相对较弱的特点,采用了自适应波段选择降维方法与基于神经网络的矢量量化方法相结合的方法对高光谱遥感图像进行压缩.首先采用自适应波段选择(Adaptive band selection)的谱间压缩方法,通过自适应地选择信息量大并且与其他波段相关性小的波段来降低高光谱数据量.然后对降维后图像在空间进行小波变换并进行矢量量化,最后对量化后数据进行自适应算术编码.实验结果表明,谱间压缩能够保留信息丰富的波段,同时计算复杂度大大降低;基于神经网络的SOFM算法及其改进算法取得较好的空间压缩效果,实现了对高光谱遥感图像的有效压缩.  相似文献   

13.
肿瘤基因选择方法LLE Score   总被引:1,自引:0,他引:1  
针对处理肿瘤基因表达数据特征选择问题,提出了一种特征选择方法 LLE Score.该方法是典型的过滤器类型特征选择方法,在样本类别信息的基础上,LLE Score针对特征向量的局部邻域保存能力进行评价,并且根据评价结果进行特征的选取,以此达到良好的特征选择效果.在实验部分对肿瘤数据集进行特征选择,并采用支持向量机分类器计算分类准确率.通过分类准确率说明了该方法的有效性.  相似文献   

14.
提出一种用于变精度邻域粗糙集,可以大幅减少时间复杂度的属性约简算法.该算法基于一种改进的辨识矩阵.首先用辨识矩阵同时记录决策一致和不一致的数据,然后用二进制位运算计算样本的邻域,最后获得可以保持下近似分布不变的属性约简.实验结果证明,本文算法不仅能够大幅减少属性约简时间,而且精度上总体优于NBRS算法和LDNRS算法.  相似文献   

15.
针对基于粒子群的属性约简算法易陷入局部最优、效率不高等问题,充分利用小生境技术在寻求最优解方面优势,提出一种基于小生境圆锥邻域粒子群的不完备决策表属性约简鲁棒算法(NCNPSO-IAR)。该算法通过圆锥分层空间构造小生境半径邻域子集向量,避免过多地依赖于先验领域知识生成小生境半径和早熟收敛,始终保持种群多样性,提高算法收敛速度。另外粒子种群在圆锥解空间充分进行约简集子矢量的协同学习,使属性约简集较好收敛到最优集。相关仿真实验表明:该属性约简优化算法是高效和鲁棒的,适用于不完备、含噪音决策表的属性约简。  相似文献   

16.
针对高维、小样本及不确定性的基因表达数据,融合模糊可容忍性的邻域粒化技术与具有全局寻优能力的鱼群智能算法,提出基于邻域粗糙集与鱼群智能的基因选择方法。首先,采用邻域粗糙集对基因数据进行邻域粒化,形成邻域粒子;其次,提出基于邻域分类精度的不确定性评价函数,用以评价邻域粒子的不确定性,分辨关键性基因;进一步融合鱼群智能方法,设计一种基因选择算法,选取分类性强的少量关键基因;最后,在两个癌症基因数据集中进行基因选择,采用SVM分类器对获取的关键基因组进行分类实验。实验结果表明,采用该方法获取的基因组具有较低的冗余度及较好的分类性能。  相似文献   

17.
K-均值算法对初始聚类中心敏感,聚类结果随不同初始聚类中心波动。针对以上问题,提出一种基于最小方差的自适应K-均值初始化方法,使初始聚类中心分布在K个不同样本密集区域,聚类结果收敛到全局最优。首先,根据样本空间分布信息,计算样本方差得到样本紧密度信息,并基于样本紧密度选出满足条件的候选初始聚类中心;然后,对候选初始聚类中心进行处理,筛选出K个初始聚类中心。实验证明,算法具有较高的聚类性能,对噪声和孤立点具有较好的鲁棒性,且适合对大规模数据集聚类。  相似文献   

18.
为了减少基于密度的异常点检测算法邻域查询操作的次数,同时避免ODBSN(Outlier Detection Basedon Square Neighborhood)中有意义异常点的丢失和稀疏聚类中的对象靠近稠密聚类时导致错误的异常点判断,提出了一种基于邻域和密度的异常点检测算法NDOD(Neighborhoodand Densitybased Outlier Detection)。NDOD吸收基于网格方法的思想,以广度优先扩张方形邻域,成倍地减少了邻域查询的次数,从而快速排除聚类点并克服基于网格方法中的“维灾”。新引入的基于邻域的局部异常因子代表候选异常点的异常程度,用于对候选异常点的精选,可避免ODBSN的缺陷,发现更多有意义的异常点。大规模和任意形状的二维空间数据的测试结果表明,该算法是可行有效的。  相似文献   

19.
用知识的条件粗糙熵定义了特征的相对重要性,提出了一种基于条件粗糙熵的入侵数据特征并行选择算法。算法首先将入侵数据决策表划分成多个子表,然后利用特征的相对重要性对各子表并行求解,最后以子表选出的局部特征为基础求得原决策表的约简。实验表明,该算法适用于大规模的入侵数据集,选出的特征属性不仅可以大大减少数据在存储、分析以及各组件共享中的代价,还能够保持并提高入侵分类的准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号