首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
针对密度峰值聚类算法需要人工设置参数、时间复杂度高的问题,提出了基于快速密度峰值聚类离群因子的离群点检测算法。首先,使用k近邻算法代替密度峰值聚类中的密度估计,采用KD-Tree索引数据结构计算数据对象的k近邻;然后,采用密度和距离乘积的方式自动选取聚类中心。此外,定义了向心相对距离、快速密度峰值聚类离群因子来刻画数据对象的离群程度。在人工数据集和真实数据集上对所提算法进行实验验证,并与一些经典和新颖的算法进行对比实验,从正确性和时间效率上验证了所提算法的有效性。  相似文献   

2.
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。  相似文献   

3.
赵嘉  王刚  吕莉  樊棠怀 《电子学报》2022,(11):2730-2737
密度峰值聚类算法倾向在球形分布数据中选择密度峰值,而流形数据多呈非球形分布,导致不能准确找到数据的类簇中心.该算法的分配策略优先对类簇中心附近的样本进行链式分配,而流形数据大量样本远离其类簇中心,导致本应属于同一类簇的样本被错误分配.为此,本文提出一种面向流形数据的测地距离与余弦互逆近邻密度峰值聚类算法.将K近邻与测地距离结合并重新定义局部密度,凸显密度峰值与非密度峰值的差异,准确找到类簇中心;将互逆近邻和余弦相似性相结合,得到基于余弦互逆近邻的样本相似度矩阵,为流形类簇准确分配样本.实验结果表明,本算法能有效发现流形数据集的几何形状并准确聚类,对真实数据集和图像数据集的聚类效果优秀.  相似文献   

4.
杨峰  刘胜强 《电子设计工程》2022,30(3):113-116,121
针对传统聚类算法对于大数据背景下大量电力大数据异常监测过程中存在的问题,提出在电力大数据异常值检测中的快速密度峰值聚类算法的改进.对传统基于密度峰值空间聚类方法进行分析,得到传统算法在使用过程中的问题.提出了快速密度峰值聚类算法的改进,对自适应参数与聚类中心自动的选择,通过标准化局部密度与距离对大数据异常值进行评测,能...  相似文献   

5.
传统的减法聚类算法时间复杂度高,算法不具有分布式特性,不满足大数据处理的要求.提出一种基于Hadoop的改进减法聚类算法,利用MapReduce模型改进减法聚类执行过程,实现求解邻域半径、初始化密度指标、更新密度指标和划分数据记录等过程的并行化.实验结果表明,同传统的串行算法相比,提出的算法能够对大数据进行快速聚类,同时表现出良好的稳定性与扩展性.  相似文献   

6.
王东  王理想 《半导体光电》2014,35(5):904-907
提出了一种基于距离相似性K-means的红外图像聚类算法。该算法对通过Isomap算法降维后的空间点,进一步进行聚类;算法中引入了密度因素,通过距离相似性的差异进一步排除孤立点和选取初始聚类中心,使数据内部的紧凑性得到加强。经过实验证明,改进后的方法比原方法更有效,时间复杂度也大幅度降低。  相似文献   

7.
针对固定网格划分技术存在的维度可扩展性差,而自适应网格划分技术未充分考虑数据集分布特征等问题,提出了一种基于概率统计理论的自适应网格聚类算法.采用概率统计和图覆盖技术,且能识别任意形状和大小的聚类,时间复杂度是数据集大小和数据维度的线性函数.实验结果表明该聚类是有效的.  相似文献   

8.
为了挖掘移动用户行为,提出了基于密度聚类的移动用户热点区域识别算法及融合加权频繁模式(Frequent Pattern,FP)树和最长公共子序列(Longest Common Subsequence,LCSS)算法的移动用户出行频繁轨迹模式提取方法。首先说明与思路相关的概念,其次采用密度聚类方法来识别城市的热点区域,最后融合加权FP树和LCSS算法来提取移动用户出行轨迹模式,并对算法在工程中的应用路径及应用效果进行了说明。  相似文献   

9.
李琪  张欣  张平康  张航 《电子科技》2019,32(5):38-44
CFSFDP算法是一种基于密度的新型聚类算法。文中针对算法需使用决策图人工选取聚类中心点的问题,利用斜率思想找出聚类中心点与非聚类中心点间的分界点,在消除主观误差的同时实现了中心点的自动求取,并最终将算法使用Spark框架进行了并行化实现。实验结果表明,文中算法在消除人为误差的同时提升了算法效率,且并行后的算法具有良好的加速比与扩展性,适用于海量数据的聚类分析。  相似文献   

10.
针对密度峰值聚类(Density Peak Clustering, DPC)算法对截断距离的取值较为敏感,密度度量标准不统一且人为选取聚类中心存在主观性的问题,提出了一种自适应引力密度峰值聚类优化(Optimized Adaptive Gravitational Density Peak Clustering Algorithm, OAGDPC)算法。首先采用模糊加权K-近邻技术(Fuzzy Weighted KNearest Neighbors Density Peak Clustering, FKNN-DPC)重新定义了局部密度,统一了密度度量的标准;然后提出一种自适应选择聚类中心的策略,结合基于引力的密度峰值(Gravitational Density Peak Clustering, GDPC)算法中牛顿万有引力定律与DPC算法的参数映射,使用引力类比距离,并设置综合考虑局部密度和引力的决策参数,依据决策参数降序折线图的顶角变化自适应确定聚类中心;最后聚集非中心点并识别异常点。实验选取DPC、GDPC、FKNN-DPC和OAGDPC在人工和UCI数据集上进行测试,结果表明,OA...  相似文献   

11.
针对雷达数据集中目标和杂波点迹的聚类不平衡问题,提出一种基于改进AdaBoost的密度峰值聚类法.介绍密度峰值聚类法的思想,基于不对称误分代价改进AdaBoost的误差函数,提高正类错分代价权重,将改进AdaBoost和密度峰值聚类结合,对由目标和杂波点迹组成的不平衡雷达数据集聚类.仿真实验结果表明,该算法在保证总体聚...  相似文献   

12.
刘俊  刘瑜  何友  孙顺 《电子与信息学报》2016,38(6):1438-1445
针对杂波环境下的多目标跟踪数据互联问题,该文提出基于全邻模糊聚类的联合概率数据互联算法(Joint Probabilistic Data Association algorithm based on All-Neighbor Fuzzy Clustering, ANFCJPDA)。该算法根据确认区域中量测的分布和点迹-航迹关联规则构造统计距离,以各目标的预测位置为聚类中心,利用模糊聚类方法,计算相关波门内候选量测与不同目标互联的概率,通过概率加权融合对各目标状态与协方差进行更新。仿真分析表明,与经典的联合概率数据互联算法(Joint Probabilistic Data Association algorithm, JPDA)相比,ANFCJPDA较大程度地改善了算法的实时性,并且跟踪精度与JPDA相当。  相似文献   

13.
ZhangYong  YuLu 《通信学报》1998,19(5):63-68
HierarchicalSearchMotionEstimationAlgorithmsforRealtimeVideoCodingZhangYongYuLuZhouFengYaoQingdong(ZhejiangUniversity,Hangzh...  相似文献   

14.
15.
李昕  雷迎科 《信号处理》2019,35(11):1919-1928
聚类作为机器学习中一种重要的无监督学习方式,在图像处理及生物基因分类上具有广泛的应用。《Clustering by fast search and find of density peaks》(DPC)提出通过寻找密度峰对数据进行分类,它既不需要迭代过程,也不需要太多参数输入。但DPC算法在球形数据集上表现较差,容易忽略潜在的聚类中心,且需要人工参与聚类中心选取。针对上述问题,本文采用模糊邻域关系计算数据密度,采用比较距离代替DPC算法中的相对距离。通过对机器学习数据集的实验,将本文提出的算法同DBSCN、OPTICS、DPC在准确率和调整兰德指数上进行比较。实验结果表明本文提出的算法可行有效   相似文献   

16.
多通道判决反馈均衡器(MC-DFE)是水声相干通信克服信道多径效应、消除码间干扰(ISI)的主要手段。为了减少多通道数据处理的复杂性、优化算法、提高算法精度,该文提出了自适应自最优预合并多通道判决反馈均衡算法。该算法将快速自优化LMS分集合并(FOLMSDC)算法、快速自优化LMS(FOLMS)算法和快速自优化LMS相位补偿(FOLMSPC)算法有机地结合在一起,使用统一的误差信号,按照最小化均方误差(MMSE)准则调节各部分的系数,从而实现均衡器性能的全局最优。仿真试验和湖上试验对该算法的性能进行了分析。实验结果表明,该文提出的算法可以进一步减少运算量,提高通信系统的接收性能,算法性能优于已有算法。  相似文献   

17.
模糊聚类是近年来使用的一类性能较为优越的聚类算法,但该类算法对初始聚类中心敏感且对边界样本的聚类结果不够准确。为了提高聚类准确性、稳定性,该文通过联合多个模糊聚类结果,提出一种距离决策下的模糊聚类集成模型。首先,利用模糊C均值(FCM)算法对数据样本进行多次聚类,得到相应的隶属度矩阵。然后,提出一种新的距离决策方法,充分利用得到的隶属度关系构建一个累积距离矩阵。最后,将距离矩阵引入密度峰值(DP)算法中,利用改进的DP算法进行聚类集成以获取最终聚类结果。在UCI机器学习库中选择9个数据集进行测试,实验结果表明,相比经典的聚类集成模型,该文提出的聚类集成模型效果更佳。  相似文献   

18.
该文针对现有聚类算法在雷达信号分选应用中复杂度高,准确性低的问题,研究了一种基于锥面簇分配的支持向量聚类算法,该算法在数据空间进行簇分配,避免了特征空间中计算邻接矩阵带来的高复杂度问题。该文将此算法引入雷达信号分选中,并在此基础上对其进行改进,使改进后的算法能对异常值做进一步处理,以达到缩短消耗时间的同时提高正确率的目的。同时以信息熵的理论描述类内聚集度和类间分离度,应用相似熵指标验证分选效果的有效性。仿真结果表明,该方法在提高分选正确率的同时可以有效降低计算复杂度。  相似文献   

19.
燕京京  王鹏  范家兵  黄焱 《电子学报》2016,44(2):405-412
提出了一种基于量子谐振子模型的聚类中心选取算法.该算法以量子谐振子波函数从高能态到基态过程中的概率变化过程为理论模型来描述聚类问题中数据对象向聚类中心点的聚集行为,能够快速查找到最优的聚类个数及较好的聚类中心点所在的网格;数据读入网格结构之后,算法的处理时间与数据集规模无关.实验结果表明:CCSA-QHOM算法较适合于处理每个子类局部区域的网格密度分布呈单峰特性的数据集的聚类中心选择问题.  相似文献   

20.
一种基于网络密度分簇的移动信标辅助定位方法   总被引:1,自引:0,他引:1  
赵方  马严  罗海勇  林权  林琳 《电子与信息学报》2009,31(12):2988-2992
现有移动信标辅助定位算法未充分利用网络节点分布信息,存在移动路径过长及信标利用率较低等问题。该文把网络节点分簇、增量定位与移动信标辅助相结合,提出了一种基于网络密度分簇的移动信标辅助定位算法(MBL(ndc))。该算法选择核心密度较大的节点作簇头,采用基于密度可达性的分簇机制把整个网络划分为多个簇内密度相等的簇,并联合使用基于遗传算法的簇头全局路径规划和基于正六边形的簇内局部路径规划方法,得到信标的优化移动路径。当簇头及附近节点完成定位后,升级为信标,采用增量定位方式参与网络其它节点的定位。仿真结果表明,该算法定位精度与基于HILBERT路径的移动信标辅助定位算法相当,而路径长度不到后者的50%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号