首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
针对基于密度的离群点检测方法在不同分布的数据集上检测精度低的问题,提出了一种基于期望核密度离群因子的离群点检测算法。首先,引入k近邻和反向k近邻扩展邻域空间(ENS)代替传统的k邻域范围,更加全面地考虑数据对象的邻域信息;其次,在传统核密度估计(KDE)方法的基础上引入多元高斯函数,在扩展邻域空间内估计数据对象的密度,同时借鉴自适应核带宽的思想,更好地适应不同数据集的数据分布;然后,给出期望距离的概念,进一步区分局部离群点和位于低密度区域的正常点;最后,定义了期望核密度离群因子刻画数据对象离群程度。在人工数据集和真实数据集上对所提算法进行实验验证,并与部分传统算法进行对比,验证了所提算法的有效性。  相似文献   

2.
基于非线性数据变换的离群点检测算法   总被引:1,自引:0,他引:1  
为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群点检测算法,首先将非线性问题转化为高维特征空间中的线性问题,然后利用非线性数据变换进行维数约减,对所得数据对象每个投影分量逐个判断数据点是否是离群点,通过实验证明该算法不仅可用于线性可分数据集的离群点检测,而且可用于线性不可分数据集的离群点检测,表明了算法的优越性。  相似文献   

3.
仲训标  黄晓霞 《硅谷》2012,(3):130-131
为解决高维空间下基于密度的离群点检测的低精度和高计算量的问题,提出基于特征选择和子空间搜索的离群点检测算法。该算法先通过特征选择选择数据的主要属性,然后对这些属性进行子空间搜索,从而有效的降低维数和避免全局搜索。最后通过一个数据集的实验来说明该算法的有效性。  相似文献   

4.
目的在研发设计空间站跑步机时,需要时刻利用微重力环境对样机进行实验验证。由此,工程师提出了微重力锻炼平台机械原理方案。微重力运动锻炼平台是一个在地面重力环境下模拟微重力环境的系统,可分别模拟航天员空间站微重力走跑训练和月球表面行走技能。为了让机械方案变成可供锻炼者使用的器材,就需要对其进行造型研究,以得出微重力运动锻炼平台竖直跑带长度、宽度以及显示屏距跑带的水平距离的人机工程尺寸,同时还要得出符合锻炼者审美的外观造型与配色方案。方法通过对空间站跑步机原理样机的研究分析,以人机工程学理论为指导,进行了平台的相关人机工程数据设计。通过对固定脚、立柱的形态与尺寸设计,对跑台的装饰设计,对肢体悬挂系统支架的包装设计,使得微重力锻炼平台的形态结构更加安全、稳定、均衡。结论锻炼平台的造型设计必须严格按照人机工程学原理进行,才能保证其安全性与合理性。  相似文献   

5.
针对旋转机械故障数据聚类分析中的初始聚类中心不确定和孤立点敏感问题,提出了一种集成多策略改进的模糊C均值(FCM)聚类方法。首先以故障数据集的决策属性为等价关系对数据集进行划分,得到若干个由等价关系导出的等价类;然后以每个等价类为可行域,采用均值漂移方法搜索故障数据类中心;最后以搜索到的类中心为FCM算法的初始聚类中心,通过核技术计算故障数据样本与相应类中心在高维特征空间中的欧氏距离,从而实现数据样本相似性的有效度量,并完成故障数据的模糊聚类。通过标准数据集和旋转机械故障数据集对方法的性能进行了验证及比较分析。结果显示,改进FCM算法的聚类性能相比传统FCM算法的聚类性能得到了明显提升,在收敛速度和聚类准确性两个性能指标上,改进的FCM算法比FCM算法具有显著优势。  相似文献   

6.
提出一种自适应局部独立分量分析降噪算法。该算法先将一维时间序列重构到高维相空间,用聚集模糊K均值聚类和聚类评价函数求取高维数据集的聚类个数和聚类中心位置,然后利用K均值聚类寻找局部投影区间,对每个聚类进行独立分量分析并投影到低维空间,将低维空间数据排列并重构成一维时间序列。与使用聚类的局部独立分量分析相比,该算法具有自适应性和稳定性。使用数值仿真试验和齿轮故障信号对该算法进行验证,结果表明该算法对此类信号具有良好的降噪效果。  相似文献   

7.
为了提高高维数据集合离群数据挖掘效率,提出了一种基于流形学习的离群点检测算法.局部线性嵌入(locally linear embedding,LEE)算法是流形学习中有效的非线性降维方法,它的优势在于只定义唯一的参数,即邻域数.根据LLE算法的思想寻找样本数据的内在嵌入分布,并通过邻域数选取和降维后数据点之间的距离调整,提高了数据集中离群点发现效率,同时利用离群点权值判别式进行权值数据判定,根据权值的大小标识出数据集中的离群点,仿真实验的结果表明了该方法能够有效地发现高维数据集中的离群点.与此同时,该算法具有参数估计简单、参数影响不大等优点,该算法为离群点检测问题的机器学习提供了一条新的途径.  相似文献   

8.
在体绘制领域和图像分割中,数据集通常具有流形结构,各部分边界连接紧密且伴随局部噪声,给传统聚类算法的应用带来了较大的困难.本文根据非参数密度估计方法提出了一种基于多尺度信息融合的层次聚类算法.新算法通过整合密度差异和边界信息构造了一种多尺度结构信息融合的相似性度量,通过水平集的图连接策略推导出一种层次化的类结构剖析过程以获取稳定的聚类结果.新算法不受数据集形状、密度类型的限制,无需对数据集进行假设,可自动识别数据集常见的聚类结构特征.同时聚类结果较为稳定,算法对噪声具有较强的鲁棒性.从人工数据集和真实数据集以及应用试验的测试结果可以看出新算法的优越性能.  相似文献   

9.
现有的无线电信号调制识别方法在先验数据不足时通常很难对无类标信号进行有效识别。针对这个问题,本文提出了一种基于知识迁移的深度学习无线电信号聚类方法(DTC)。该方法基于样本对比,分析样本间的相似性,并利用卷积神经网络(CNN)提取无线电信号的特征,同时设计了一种预训练框架,通过迁移同领域数据集的知识,有效提升了CNN特征提取能力,实现了引导聚类方向、提升聚类性能的目标。实验结果表明,该方法在多个公开数据集上的聚类性能都显著优于现有的聚类方法。与现有方法相比,DTC在RML 2016.10A和RML 2016.04C数据集上的聚类精度分别提升了30.34%和28.04%。  相似文献   

10.
齐昶  王斌  丁海军 《声学技术》2011,(6):547-551
针对跳频信号分选,主要研究了聚类算法及利用直方图来预估计聚类数目及初始中心的方法.首先对直方图方法进行改进,得到了对跳频信号参数估计值误差不敏感的方法,其次对初始化中心不敏感的KHM聚类算法进行改进并聚类,最后提出了通过定义类内距类间距的方法来确定最佳聚类数的算法.通过改进的KHM算法和估计聚类个数方法,利用跳频信号参...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号