首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
鉴于传统方法不能直接有效地对多元时间序列数据进行聚类分析,提出一种基于分量属性近邻传播的多元时间序列数据聚类方法.通过动态时间弯曲方法度量多元时间序列数据之间的总体距离,利用近邻传播聚类算法分别对数据之间的总体距离矩阵和分量近似距离矩阵进行聚类分析,综合考虑这两种视角下序列数据之间的关联关系,使用近邻传播方法对反映原始多元时间序列数据的综合关系矩阵实现较高质量的聚类.数值实验结果表明,与传统聚类方法相比,所提出方法不仅能够有效地反映总体数据特征之间的关系,而且通过重要分量属性序列之间的关联关系分析能够提高原始时间序列数据的聚类效果.  相似文献   

2.
朱二周  孙悦  张远翔  高新  马汝辉  李学俊 《软件学报》2021,32(10):3085-3103
聚类分析是统计学、模式识别和机器学习等领域的研究热点.通过有效的聚类分析,数据集的内在结构与特征可以被很好地发掘出来.然而,无监督学习的特性使得当前已有的聚类方法依旧面临着聚类效果不稳定、无法对多种结构的数据集进行正确聚类等问题.针对这些问题,首先将K-means算法和层次聚类算法的聚类思想相结合,提出了一种混合聚类算法K-means-AHC;其次,采用拐点检测的思想,提出了一个基于平均综合度的新聚类有效性指标DAS(平均综合度之差,difference of average synthesis degree),以此来评估K-means-AHC算法聚类结果的质量;最后,将K-means-AHC算法和DAS指标相结合,设计了一种寻找数据集最佳类簇数和最优划分的有效方法.实验将K-means-AHC算法用于测试多种结构的数据集,结果表明:该算法在不过多增加时间开销的同时,提高了聚类分析的准确性.与此同时,新的DAS指标在聚类结果的评价上要优于当前已有的常用聚类有效性指标.  相似文献   

3.
杨虎  付宇  范丹 《计算机科学》2018,45(7):22-30, 52
聚类内部有效性指标是在未知样本真实分类情况下用于评价聚类结果优劣、寻找最佳聚类个数的指标,是聚类分析研究中的重要内容。虽然已有大量的研究分析了聚类内部有效性指标的性能,且有研究结论表明某些内部有效性指标的性能良好,能够辅助聚类算法找到最佳聚类个数,但这些研究未考虑真实数据中的噪音特征对内部有效性指标的影响,研究结论可能会误导内部有效性指标的选取和应用。为此,选取了10种常用的内部有效性指标来研究噪音特征对内部有效性特征选择和聚类结果的影响。结果表明,数据中的噪音特征会影响内部有效性指标的性能,除KL指标、CH指标和CCC指标对噪音特征的反应相对不敏感外,其他内部有效性指标均对噪音特征敏感,且聚类结果的准确性会随着噪音的增强而降低。  相似文献   

4.
从用户的实际需求出发,分析了聚类系统的使用者可能对系统提出的功能要求,提出了一种基于加权Eucfid距离的模糊C聚类分析算法。在该算法中,权值是由用户或领域的专家直接指定的,加在不同特征指标上的权值体现了用户对各个特征指标重视程度的差别。与传统的模糊C聚类分析相比,该算法增加了聚类的灵活性,能够产生令用户更加满意的聚类结果。  相似文献   

5.
一个高效的多变量时间序列聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
时间序列聚类分析是数据挖掘研究的一个重要内容。已有的聚类算法大多采用k均值对低维数据进行聚类,不能对高维多变量时间序列(MTS)数据进行有效聚类。提出一种高效的多变量时间序列聚类算法PCA-CLUSTER,首先利用主成分分析对MTS数据降维;选取MTS数据的主成分序列进行K近邻聚类分析。理论分析和实验结果表明算法可以有效解决MTS数据聚类问题。  相似文献   

6.
一种基于用户需求的加权模糊聚类分析算法   总被引:1,自引:0,他引:1  
从用户的实际需求出发,分析了聚类系统的使用者可能对系统提出的功能要求,提出了一种基于加权Euclid距离的模糊C聚类分析算法.在该算法中,权值是由用户或领域的专家直接指定的,加在不同特征指标上的权值体现了用户对各个特征指标重视程度的差别.与传统的模糊C聚类分析相比,该算法增加了聚类的灵活性,能够产生令用户更加满意的聚类结果.  相似文献   

7.
针对K-means在聚类过程中存在的随机性强、准确率不稳定等问题,提出了一种改进聚类算法,首先选取k个首尾相连且距离乘积最大的数据对象作为初始聚类中心,在簇中心迭代过程中,选取簇内距离和最小的样本作为簇中心,再将其他样本划分至相应簇中,反复迭代,直至收敛。在UCI数据集上的仿真实验结果表明:新算法与K-means算法和其他两种改进算法相比,不仅能够降低运算耗时,在准确率、Jaccard系数、F值等多项聚类指标上也有较大的提升,在实际应用中,使用新算法对现代学徒制的职业能力进行了聚类分析,解决了课程间的序化问题。  相似文献   

8.
传统的聚类算法在考虑类与类之间的连通性特征和近似性特征上往往顾此失彼。首先给出类边界点和类轮廓的基本定义以及寻求方法,然后基于类间连通性特征和近似性特征的综合考虑,拟定一些类间相似性度量标准和方法,最后提出一种基于类轮廓的层次聚类算法。该算法能够有效处理任意形状的簇,且能够区分孤立点和噪声数据。通过对图像数据集和Iris标准数据集的聚类分析,验证了该算法的可行性和有效性。  相似文献   

9.
杨华晖  孟晨  王成  姚运志 《控制与决策》2019,34(6):1219-1226
针对高维数据聚类中K-means算法无法有效抑制噪声特征、实现不规则形状聚类的缺点,提出一种基于目标点特征选择和去除的改进K-均值聚类算法.该算法使用闵可夫斯基规度作为评价距离进行目标点的分类,增设权重调节参数a、重置权重系数α进行特征选择和去除,可有效减小非聚类指标特征带来的噪声影响.算法验证实验选取UCI真实数据集和人工数据集进行聚类分析,验证改进算法对抑制噪声特征的有效性,与WK-means、iMWK-means算法进行实验对比,分析聚类学习时特征选择的适用性,同时寻找最优的距离系数beta和权重系数α.  相似文献   

10.
为了提高变电站综合自动化系统远动指标统计分析能力,需要对变电站综合自动化系统远动指标进行统计处理,提出一种基于模糊聚类和关联规则挖掘的变电站综合自动化系统远动指标统计分析算法。采用分段检验分析方法进行变电站综合自动化系统远动指标的信息采集,提取变电站综合自动化系统远动指标的关联规则特征量,结合模糊融合聚类方法进行变电站综合自动化系统远动指标的大数据聚类处理,采用互信息特征检测方法,进行变电站综合自动化系统远动指标的大数据挖掘和信息检测,根据特征检测结果采用分段模糊聚类方法进行特征归类处理,在聚类空间中实现变电站综合自动化系统远动指标统计分析。仿真结果表明,采用该算法进行变电站综合自动化系统远动指标的统计分析能力较强,大数据聚类性较好,提高了指标统计分析和决策能力。  相似文献   

11.
樊仲欣  王兴  苗春生 《计算机应用》2019,39(4):1027-1031
为解决利用层次方法的平衡迭代规约和聚类(BIRCH)算法聚类结果依赖于数据对象的添加顺序,且对非球状的簇聚类效果不好以及受簇直径阈值的限制每个簇只能包含数量相近的数据对象的问题,提出一种改进的BIRCH算法。该算法用描述数据对象个体间连通性的连通距离和连通强度阈值替代簇直径阈值,还将簇合并的步骤加入到聚类特征树的生成过程中。在自定义及iris、wine、pendigits数据集上的实验结果表明,该算法比多阈值BIRCH、密度改进BIRCH等现有改进算法的聚类准确率更高,尤其在大数据集上比密度改进BIRCH准确率提高6个百分点,耗时降低61%。说明该算法能够适用于在线实时增量数据,可以识别非球形簇和体积不均匀簇,具有去噪功能,且时间和空间复杂度明显降低。  相似文献   

12.
基于二阶模糊聚类算法的雷达目标距离像识别   总被引:1,自引:0,他引:1  
彭翔  周代英 《计算机应用》2011,31(2):399-401
针对于模糊C-均值(FCM)算法敏感于聚类中心初始值的缺点,提出一种基于二阶模糊聚类方法。该方法利用传递闭包(TC)算法无初始化的优点,先对样本集按一定分类水平进行划分,选取若干类,求得这些类的样本均值作为FCM算法的初始聚类中心。一方面能够获得理想的聚类中心初始值,同时还能通过分类水平值来优化聚类中心数和聚类中心,避免局部最优,克服一致性聚类。利用该算法对三类飞机目标的实测一维距离像数据进行了识别实验,实验结果表明,基于二阶模糊聚类方法的识别率比FCM有了明显的改善。  相似文献   

13.
无线传感器网络簇头优化分簇算法及其性能仿真   总被引:4,自引:0,他引:4  
陈静  张晓敏 《计算机应用》2006,26(12):2787-2788
基于对LEACH等算法的研究,提出一种传感器网络分簇算法——簇头优化分簇算法。它将节点周期性划分为数个在地理位置上分布均匀的“临时簇”,然后分别在每个临时簇内选择簇头;簇头选择时,遵循保护最低能量节点的原则,即要求所选簇头尽量靠近剩余能量最低的节点。仿真结果表明,与LEACH相比较,该算法能保证簇头较均匀分布在网络中,推迟第一个死亡节点出现的时间,同时也提高了基站接收的数据量。  相似文献   

14.
密度峰值聚类算法(DPC)能够有效地进行非球形数据的聚类,该算法需要输入截断距离,人工截取聚类中心,导致DPC算法的聚类效果有时较差。针对这些问题,提出一种结合密度比和系统演化的密度峰值聚类算法(DS-DPC)。利用自然最近邻搜索得出各样本点的邻居数目,根据密度比思想改进密度计算公式,使其能够反映周围样本的分布情况;对局部密度与相对距离的乘积进行降序排列,根据排序值选出聚类中心,将剩余样本按照DPC算法的分配策略进行聚类,避免了手动选择聚类中心的主观性;利用系统演化方法判断聚类结果是否需要合并或分离。通过在多个数据集上进行实验,并与其他聚类算法进行比较,实验结果表明,该算法具有较好的聚类效果。  相似文献   

15.
针对密度峰值聚类算法受人为干预影响较大和参数敏感的问题,即不正确的截断距离dc会导致错误的初始聚类中心,而且在某些情况下,即使设置了适当的dc值,仍然难以从决策图中人为选择初始聚类中心。为克服这些缺陷,提出一种新的基于密度峰值的聚类算法。该算法首先根据K近邻的思想来确定数据点的局部密度,然后提出一种新的自适应聚合策略,即首先通过算法给出阈值判断初始类簇中心,然后依据离初始类簇中心最近分配剩余点,最后通过类簇间密度可达来合并相似类簇。在实验中,该算法在合成和实际数据集中的表现比DPC、DBSCAN、KNNDPC和K-means算法要好,能有效提高聚类准确率和质量。  相似文献   

16.
王治和  王淑艳  杜辉 《计算机工程》2021,47(5):88-96,103
模糊C均值(FCM)聚类算法无法识别非凸数据,算法中基于欧式距离的相似性度量只考虑数据点之间的局部一致性特征而忽略了全局一致性特征。提出一种利用密度敏感距离度量创建相似度矩阵的FCM算法。通过近邻传播算法获取粗类数作为最佳聚类数的搜索范围上限,以解决FCM算法聚类数目需要人为预先设定和随机选定初始聚类中心造成聚类结果不稳定的问题。在此基础上,改进最大最小距离算法,得到具有代表性的样本点作为初始聚类中心,并结合轮廓系数自动确定最佳聚类数。基于UCI数据集和人工数据集的实验结果表明,相比经典FCM、K-means和CFSFDP算法,该算法不仅具有识别复杂非凸数据的能力,而且能够在保证聚类性能和稳定性的前提下加快收敛速度。  相似文献   

17.
能耗均衡的无线传感器网络两级路由协议*   总被引:2,自引:1,他引:1  
传感器网络分簇路由协议研究的一个关键问题是如何最优化组簇,既能有效降低簇内节点能耗,又能均衡整个网络能耗。为此,提出一种能耗均衡的网络两级分层分簇路由协议。协议底层应用PSO算法实现网络节点最优化分簇;上层选择总簇头节点负责收集、融合簇头数据并发送至基站。仿真结果表明,本协议能有效降低节点死亡速度,延长网络生存周期。  相似文献   

18.
基于近邻传播与密度相融合的进化数据流聚类算法   总被引:3,自引:0,他引:3  
邢长征  刘剑 《计算机应用》2015,35(7):1927-1932
针对目前数据流离群点不能很好地被处理、数据流聚类效率较低以及对数据流的动态变化不能实时检测等问题,提出一种基于近邻传播与密度相融合的进化数据流聚类算法(I-APDenStream)。此算法使用传统的两阶段处理模型,即在线与离线聚类两部分。不仅引进了能够体现数据流动态变化的微簇衰减密度以及在线动态维护微簇的删减机制,而且在对模型采用扩展的加权近邻传播(WAP)聚类进行模型重建时,还引进了异常点检测删除机制。通过在两种类型数据集上的实验结果表明,所提算法的聚类准确率基本能保持在95%以上,其纯度对比实验等其他相关测试都有较好结果,能够高实效、高质量、高效率地处理数据流数据聚类。  相似文献   

19.
创意FCM算法     
针对现有模糊聚类方法仅仅是对已有数据点的聚类的不足,提出了在已有数据集的基础上找到新的一类集群的聚类方法 CFCM。该算法在FCM算法的基础上,通过引入观测点P作为聚类的先验知识,来大致确定未知集群的聚类中心,定义了权重系数λ来限定观测点对新的一类聚类中心形成的影响程度。人造数据集和UCI真实数据集的实验结果表明,该算法不仅对已知数据点有较好的聚类效果,并且可以在观测点P的作用下在特定区域创造出新的一类无已知数据点的集群中心点的大致位置,因而在实际中有潜在应用价值。  相似文献   

20.
基于捕食-被捕食粒子群优化的模糊聚类   总被引:1,自引:0,他引:1       下载免费PDF全文
粒子群优化聚类算法具有参数简单,收敛快等优势,但也有局部极值问题。为解决此问题,提出一种基于捕食-被捕食的粒子群优化模糊聚类算法且聚类中心采用密度函数初始化。捕食者追逐被捕食者中心,加速收敛,而被捕食者逃离捕食者,促进多样性,以防局部极值出现。实验测试数据表明,算法具有防止局部极值、收敛快、全局寻优能力强等性能优势,能够比较好客观地反映现实世界。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号