首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
为解决城市道路中相邻车辆聚类精度低的问题,本文提出了一种改进的密度峰值模糊聚类算法。首先,该算法使用自适应椭圆距离代替欧式距离,并在决策图中引入指数函数曲线选择密度峰值点,以确定初始聚类中心和聚类数目;接着,将初始信息代入模糊C均值(FCM)聚类算法中,经迭代计算取得一次聚类结果;最后,根据雷达数据中同一辆车的数据点速度差值极小、不同车辆的速度差值相对较大这一特征,引入和速度相关的目标函数,并通过迭代计算取得最终的聚类结果,以对一次聚类结果进行修正。根据真实道路测量数据的实验证明,本文提出的聚类算法精度高、鲁棒性好,能正确聚类城市道路中相邻的车辆目标,具有更好的聚类效果。为道路中车辆的跟踪、交通状态预估等处理提供可靠、准确的目标信息,大大减少后续工程的计算量。  相似文献   

2.
不平衡数据是监督学习中的一个挑战性问题。传统的分类器通常偏向多数类,忽略了少数类,而少数类样本往往包含很多重要信息,需要得到更多的关注。针对此问题,提出了一种基于密度峰值聚类算法的过采样技术(An Oversampling Technique based on Density Peak Clustering, DPCOTE)。DPCOTE的主要思想是:(1)利用k近邻算法去除多数类和少数类噪声样本;(2)基于密度峰值聚类算法(Density peaks clustering algorithm, DPC)中的2个重要因子,即样本局部密度和样本到局部密度较高的最近邻的距离,来为每个少数类样本分配采样权重;(3)对于DPC算法中涉及到的距离,使用马氏距离来度量,以消除样本特征量纲不一致问题。最后,在12个UCI数据集上进行了对比实验,用不同的指标评价分类结果,结果表明本文提出的算法在处理不平衡分类问题时优于其它过采样方法。  相似文献   

3.
密度峰值聚类算法(Clustering by fast search and find of density peaks,DPC)的截断距离参数需人工干预,且参数选取对聚类结果产生较大的影响.为解决这一问题,提出了一种基于改进果蝇优化的密度峰值聚类算法.通过Tent混沌映射初始化果蝇种群,利用Tent混沌序列随机性、遍历性和规律性的特点来提高初始种群的多样性,增强算法的全局探索能力;并引入动态步长因子与柯西变异策略对基本果蝇优化算法(Fruit Fly Optimization Algorithm,FOA)的更新机制进行改进,加强局部勘探能力,帮助算法跳出局部最优;利用随机算法收敛准则从理论上对改进FOA算法的收敛性进行分析;在6个基准测试函数上进行实验仿真,结果表明改进的FOA算法具有更快的收敛速度及更高的求解精度;将改进FOA算法与DPC算法融合成新算法,利用改进FOA算法较强的寻优能力找到最佳截断距离并实现最终的聚类.实验结果表明,新算法在UCI数据集及人工数据集上的聚类性能均有改善,相较于DPC算法、FOA-DPC算法、FADPC算法及ACS-FSDP算法具有更优的性能指标,有效抑制了手动选取截断距离参数带来的影响问题.  相似文献   

4.
针对密度峰值聚类(Density Peak Clustering, DPC)算法对截断距离的取值较为敏感,密度度量标准不统一且人为选取聚类中心存在主观性的问题,提出了一种自适应引力密度峰值聚类优化(Optimized Adaptive Gravitational Density Peak Clustering Algorithm, OAGDPC)算法。首先采用模糊加权K-近邻技术(Fuzzy Weighted KNearest Neighbors Density Peak Clustering, FKNN-DPC)重新定义了局部密度,统一了密度度量的标准;然后提出一种自适应选择聚类中心的策略,结合基于引力的密度峰值(Gravitational Density Peak Clustering, GDPC)算法中牛顿万有引力定律与DPC算法的参数映射,使用引力类比距离,并设置综合考虑局部密度和引力的决策参数,依据决策参数降序折线图的顶角变化自适应确定聚类中心;最后聚集非中心点并识别异常点。实验选取DPC、GDPC、FKNN-DPC和OAGDPC在人工和UCI数据集上进行测试,结果表明,OA...  相似文献   

5.
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。  相似文献   

6.
杨峰  刘胜强 《电子设计工程》2022,30(3):113-116,121
针对传统聚类算法对于大数据背景下大量电力大数据异常监测过程中存在的问题,提出在电力大数据异常值检测中的快速密度峰值聚类算法的改进.对传统基于密度峰值空间聚类方法进行分析,得到传统算法在使用过程中的问题.提出了快速密度峰值聚类算法的改进,对自适应参数与聚类中心自动的选择,通过标准化局部密度与距离对大数据异常值进行评测,能...  相似文献   

7.
基于FCM的无监督最优模糊聚类算法   总被引:1,自引:0,他引:1  
基于模糊c-均值算法的无监督最优模糊聚类算法集合了模糊c均值算法与无监督最优聚类算法的优点,它通过逐渐改变聚类数c,依据一些有效性衡量尺度,能无监督搜索出最优聚类数c.通过对距离测量尺度的改进,使聚类不受类形状的影响,以达到具备更高准确率的聚类效果.仿真实验结果表明,新算法不仅能准确找出聚类数,而且跟单纯的模糊c均值算法比,具有更好的聚类效果.  相似文献   

8.
针对密度峰值聚类算法需要人工设置参数、时间复杂度高的问题,提出了基于快速密度峰值聚类离群因子的离群点检测算法。首先,使用k近邻算法代替密度峰值聚类中的密度估计,采用KD-Tree索引数据结构计算数据对象的k近邻;然后,采用密度和距离乘积的方式自动选取聚类中心。此外,定义了向心相对距离、快速密度峰值聚类离群因子来刻画数据对象的离群程度。在人工数据集和真实数据集上对所提算法进行实验验证,并与一些经典和新颖的算法进行对比实验,从正确性和时间效率上验证了所提算法的有效性。  相似文献   

9.
卢晶  段勇  刘海波 《电子学报》2018,46(3):730-738
密度峰值聚类算法由于在发现任意形状簇且不需指定聚类个数等方面具有一定的优势而被广泛关注.但是该算法需要计算数据集中所有点的密度和点对之间的距离,因此不适合处理大规模高维数据集.为此,本文提出了一种基于z值的分布式密度峰值聚类算法,DP-z.本方法利用空间z填充曲线将高维数据集映射到一维空间上,根据数据点的z值信息对数据集分组.为了能够得到正确的结果,需要对分组间数据进行交互,然后并行计算每个点密度和斥群值.DP-z算法在分组间数据交互时采用过滤策略,减少大量无效距离计算和数据传输开销,有效提高算法的执行效率.最后,本文在云计算平台上对DP-z算法进行了验证,实验表明在保证DP-z算法与原始密度峰值聚类算法聚类结果相同的情况下有效的提高了算法执行效率.  相似文献   

10.
在雷达信号分选中引入密度峰值聚类,可以快速发现聚类中心点,无需确定聚类数目。借鉴势熵概念提出密度熵,优化了聚类中核函数截断距离的选取算法。对如何自动判断聚类数目和聚类中心点问题进行了研究,设计了门限函数和判断规则,还对原算法的分配、合并准则进行了优化。仿真实验结果证明了该算法的有效性。  相似文献   

11.
针对雷达数据集中目标和杂波点迹的聚类不平衡问题,提出一种基于改进AdaBoost的密度峰值聚类法.介绍密度峰值聚类法的思想,基于不对称误分代价改进AdaBoost的误差函数,提高正类错分代价权重,将改进AdaBoost和密度峰值聚类结合,对由目标和杂波点迹组成的不平衡雷达数据集聚类.仿真实验结果表明,该算法在保证总体聚...  相似文献   

12.
Clustering by Fast Search and Find of Density Peaks with Data Field   总被引:1,自引:0,他引:1  
  相似文献   

13.
一种基于密度的k-means聚类算法   总被引:1,自引:0,他引:1  
针对k-means算法中对初始聚类中心和孤立点敏感的缺点,提出一种基于密度的改进k-means算法.该算法引入信息熵和加权距离,从近邻密度出发,去除孤立点对算法的影响,同时确定初始聚类中心,使得聚类中心相对稳定.实验表明,该算法在准确性、运行效率上均有10%以上的提升.  相似文献   

14.
传统谱聚类算法在构造相似度矩阵时,高斯核函数参数选取的无规律性会对聚类结果造成严重影响。针对的这一缺陷,提出一种基于密度均值的谱聚类算法。与传统算法不同,该算法选取样本点到周围K个样本点的平均距离作为尺度参数,并引入样本点的密度信息,使得聚类结果更符合实际样本的分布。同时,由于相似矩阵能自适应不同的局部密度,使得该算法对样本的空间分布并不敏感。在不同类型数据集上的实验验证了算法的有效性和较高的鲁棒性。  相似文献   

15.
传统K-means算法的初始聚类中心从数据集中随机抽取,聚类结果会随着初始聚类中心的不同而产生波动。针对这一问题,提出一种基于密度的优化初始聚类中心选取算法,通过计算每个数据对象的密度参数和邻域距离,选取k个处于高密度分布的点作为初始聚类中心。在聚类类别数给定的情况下,使用标准的UCI数据库进行对比实验,发现改进后的算法较传统算法有相对较高的准确率和稳定性。  相似文献   

16.
基于密度和聚类指数改进的K-means算法   总被引:1,自引:0,他引:1  
传统K-means算法中,随机选择到的初始聚类中心不同会得到不一样的簇类,人工给定的k值与实际聚类数较难达到一致,针对这些问题,文中提出了基于密度和聚类指数改进的K-means聚类算法。根据密度获取高密度集HP,从此集合中选择相互之间距离最大的两对对象均值当成第一轮聚类的聚类中心,新的聚类中心可通过最大距离积法获取,并参考聚类指数确定合适的k值。通过进行实验确认了该算法有较高的准确性和有效性。  相似文献   

17.
提出了一种新的粒子群密度聚类算法和对粒子群的初始化方法。该算法具有传统粒子群算法寻找最优解的特点,同时从密度的角度考虑了数据总体的分布,增强了寻找局部最优解的能力,并通过对粒子群的初始化加快了粒子群的收敛速度,得到了更好的聚类效果。对仿真数据和IRIS真实数据的实验结果证明,该算法聚类效果优于传统粒子群聚类算法和K均值算法。  相似文献   

18.
刘振  杨俊安  刘辉  王伟 《信号处理》2016,32(6):651-659
传统机器学习要求训练样本和测试样本具有相同分布的假设在实际应用中难以满足,为解决这种问题,迁移学习的研究近年来逐渐兴起。其中,基于聚类分析与重采样的迁移学习框架不需要直接估计域分布,且能够修正不同类型的域间差异,但其所采用的聚类算法对参数选择的鲁棒性及不同分布数据的适应性较差,并不能很好地适用于挖掘数据结构信息。为此,该文提出一种基于模糊近邻密度聚类与重采样的迁移学习算法。该方法对不同分布形状和密度的数据具有较好的鲁棒性并能够发现更多的近邻结构信息,能够从源域中迁移更多的有用知识用于目标域的学习。在公共数据集上的实验结果表明所提出的迁移学习方法具有更好的性能。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号