首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
一种基于加权复杂网络特征的K-means聚类算法   总被引:1,自引:0,他引:1  
在分析了传统的基于划分的K—means聚类算法的优越性和存在不足的基础上,根据近两年复杂网络研究中部分新的理论成果,提出了复杂网络加权度、加权聚集度与加权聚集系数的定义,并将数据聚类转换为复杂网络上的节点聚类,提出基于加权复杂网络特征的K—means聚类算法(简称WCNFC算法)。实验结果表明,该算法根据节点加权复杂网络特征值,能够较好地找到聚类中心,有效地避免了对初始化选值敏感性的问题,从而使得聚类质量大大提高。  相似文献   

2.
基于K-means聚类算法的复杂网络社团发现新方法   总被引:4,自引:3,他引:1  
提出了一种基于K-means聚类算法的复杂网络社团结构划分方法。算法基于Fortunato等人提出的边的信息中心度,定义了节点的关联度,并通过节点关联度矩阵来进行聚类中心的选择和节点聚类,从而将复杂网络划分成k个社团,然后通过模块度来确定网络理想的社团结构。该算法有效地避免了K-means聚类算法对初始化选值敏感性的问题。通过Zachary Karate Club和College Football Network两个经典模型验证了该算法的可行性。  相似文献   

3.
K-means算法是一种基于划分的聚类算法,具有算法简单且收敛速度快的特点。但该算法的性能依赖于聚类中心的初始位置的选择。拓展了复杂网络的重要特征,针对带有属性的数据对象所构成的数据集,定义了多维属性对象的度、聚集度和聚集系数,选取度和聚集系数高的K个点作为K-means聚类的初始中心点。实验数据表明,改进后的K-means算法较传统的算法具有更高的效率和准确度。  相似文献   

4.
文本聚类是文本挖掘的一种重要方法,提出了一种加权复杂网络社团划分的新算法,通过不断寻找复杂网络中的稠密集并对其进行适当操作,达到了划分加权复杂网络的目的.将该算法应用于文本聚类,将文本用向量空间模型表示,用余弦公式计算文本之间的相似度,根据邻居节点构造出加权复杂网络,用提出的算法对加权复杂网络进行社团划分.对Reute...  相似文献   

5.
自治异构数据源聚集模型与算法研究   总被引:1,自引:0,他引:1  
自治异构数据源信息共享的主要问题是如何在P2P环境下对自治数据节点的信息进行统一访问.采用分层结构组织数据源节点能够提高查询效率,减小计算开销,但需要节点根据彼此相似度实现局部的聚类.给出了数据源节点信息发布的形式化描述,提出了基于模式元素匹配的自治异构数据源多重聚集模型以及聚类组织构建过程,采用TA算法解决top-K聚类节点搜索问题,并在此基础上提出TAL算法.实验结果表明,TA和TAL算法能够高效地解决节点聚类排序的问题,特别是TAL算法在聚类节点范围较大时计算性能优于TA.  相似文献   

6.
针对加权模块度函数聚类算法在蛋白质相互作用网络中进行复合物识别的准确率不高、召回率较低以及时间性能不佳等问题进行了研究,提出一种基于模块度函数的加权蛋白质复合物识别算法IWPC-MF(Algorithm for Identifying Weighted Protein Complexes based on Modularity Function)。融合点聚集系数改进边聚集系数,将改进后的边点聚集系数与基因共表达的皮尔逊相关系数结合来构建加权蛋白质网络;基于节点权重选取种子节点,遍历种子的邻居节点,设计节点间的相似度度量和蛋白质附着度来获取初始聚类模块;设计基于紧密度的蛋白质复合物模块度函数来合并初始模块,并最终完成复合物的识别,克服传统的模块度函数无法识别出重叠和规模较小的复合物的缺陷。将IWPC-MF算法应用在DIP数据上进行复合物的识别,实验结果表明IWPC-MF算法的准确率和召回率较高,能够较准确地识别蛋白质复合物。  相似文献   

7.
基于加权复杂网络聚类的医学图像分类器研究   总被引:1,自引:0,他引:1  
为了建立高效的肿瘤自动诊断系统,克服因医学MIR图像的复杂性带来的直接从图像中看出肿瘤及良、恶性质的困难,结合复杂网络社团划分的部分理论成果和K-mean聚类算法的思想,提出了基于加权复杂网络聚类的医学图像分类器.该分类器对医学图像进行预处理,建立图片特征库,构建图片加权复杂网络,在此基础上根据网络节点的加权网络特征值和连接度选取初始聚类中心进行聚类,有效地克服了传统K-mean聚类算法对初始化选值敏感性的问题,从而大大提高了分类精度.实验通过对某医院PACS系统中的部分MIR脑部图片进行分类,表明了该方法的分类精度比传统的K-mean聚类算法平均提高了8%左右.  相似文献   

8.
为降低并均衡无线传感器网络(WSN)中传感器节点的能量消耗,提出一种基于最优传输距离和K-means聚类的WSN分簇算法。根据层次聚类算法建立聚类特征树,将聚类特征树中的叶节点视为一个簇,并使每个簇控制在最优传输距离内,实现簇内节点的能耗均衡。通过目标函数对K-means聚类簇进行优化,保证簇内节点数目的均匀分布,并在考虑剩余能量和地理位置的基础上完成节点数据传输。实验结果表明,该算法在均衡网络能耗的同时,可有效延长网络生命周期。  相似文献   

9.
根据对等(P2P)网络的连接特点,提出一种基于邻居集合优先附着原则的有向加权网络拓扑生成算法。分析有向加权网络的生成及演变过程,通过合理选择接入节点的连接区域使生成的拓扑网络具有较高的聚类特性。仿真实验表明,该算法生成的拓扑结构符合P2P网络环境下具有幂率特性的拓扑结构,聚集度较高。  相似文献   

10.
蔡静颖 《微计算机信息》2012,(6):182-183,181
传统的文本聚类方法都是基于簇的算法,文本聚类错误率较高,效率较低。本文提出了一种新的文本聚类算法,首先将特征文本提取,根据特征文本之间的相似度构造一个加权的复杂网络,利用加权复杂网络社团划分方法对其网络进行社团划分,实现文本聚类。将文本特征提取,实现网络稀疏性,提高聚类效率;利用网络的社团划分提高了文本的聚类效果。实验证明该方法的可行性和有效性。  相似文献   

11.
黄月  吴成东  张云洲  程龙  孙尧 《控制与决策》2013,28(10):1497-1501
针对存在错误报警的二进制传感器网络,提出基于K均值聚类的二进制传感器网络多目标定位方法。在目标和节点间距离信息未知的条件下,提出基于K均值聚类的改进加正减负算法(KMC-ISNAP)对目标位置进行估计,引入影响因子降低分类过程中模糊节点对多目标定位误差的影响。仿真实验表明,K均值聚类方法在多个目标随机分布情况下能够对报警节点进行准确分类,与质心估计算法和加正减负算法相比, KMC-ISNAP多目标定位方法具有较高的定位精度和较好的容错性。  相似文献   

12.
为了解决传统聚类方法在多维数据集中聚类效果不佳的问题,提出了将网络社团划分的方法,并应用到多维数据聚类分析中。对于一个多维数据集,首先对分析对象进行特征提取,构建出每个对象的特征向量,通过计算皮尔森相关系数来度量不同特征向量之间的相似性,从而构建出一个相似性网络,采用Blondel算法对该网络进行社团划分达到聚类的效果。实验结果表明该方法可以在多维数据聚类中得到较好的聚类结果,准确率达到92.5%,优于K-means算法的75%。  相似文献   

13.
为解决传统聚类算法初始中心易陷入局部最优、耗时长的问题,提出一种改进的K-means聚类优化算法。该算法引入最大最小距离和加权欧氏距离,从剩余聚类点距离均值和出发,避免孤立点和边缘数据的影响。利用比重法对主成分进行改进,以由此获得的特征影响因子作为初始特征权重,构建一种加权欧氏距离度量。根据特征贡献率对聚类的影响,筛选具有代表性的特征因子凸显聚类效果,最终合成汽车行驶工况,分析瞬时油耗。结果表明,所提算法构建行驶工况的速度-加速度联合分布差异值仅为105%,比传统K-means聚类省时44.2%,行驶工况拟合度较高,能反映实际车辆的运行特征及油耗。   相似文献   

14.
传统的K-means算法虽然具有很多优点,但聚类准则函数对簇密度不均的数据集分类效果较差.文中在加权标准差准则函数的基础之上,增加了收敛性判定,并在Hadoop平台上提出了一种基于MapReduce编程思想设计与优化的K-means并行算法.与传统的K-means算法相比,设计的并行算法在聚类结果的准确性、加速比、扩展性、收敛性等方面都有显著的提高,降低了因簇密度不均引起误分的概率,提高了算法的聚类精度,并且数据规模越大、节点越多,优化的效果就越明显.  相似文献   

15.
朱海湾 《计算机应用研究》2020,37(2):390-397,420
针对基于蚁群聚类的蛋白质复合物挖掘算法中,静态PPI网络难以真实反映细胞的动态特性,收敛速度较慢、聚类准确性和召回率不高等问题,提出一种基于模糊粒度和紧密度的蚁群聚类动态加权PPI网络复合物挖掘方法(FGCDACC-DPC)。首先基于动态PPI网络的拓扑特性和生物特性设计了综合性权值度量(comprehensive weight metric,CWM),准确描述了蛋白质之间的相互作用;其次根据复合物的基本特征,构建一组稠密且高度共表达的复合核,然后设计模糊粒度和紧密度的拾起放下模型对其余节点聚类,降低了计算复杂度和随机性,加快聚类速度;最后基于功能信息传递和时序功能相关的思想分别构建了局部和全局权值更新策略,实现不同代蚁群和不同时刻网络之间的功能信息传递,提高聚类准确性。将FGCDACC-DPC算法应用在DIP数据上进行复合物挖掘,实验结果表明该算法的精度和召回率较高,能够较准确地识别蛋白质复合物。  相似文献   

16.
基于核的非凸数据模糊K-均值聚类研究   总被引:4,自引:4,他引:0  
将模糊K-均值聚类算法与核函数相结合,采用基于核的模糊K-均值聚类算法来进行聚类。核函数隐含地定义了一个非线性变换,将数据非线性映射到高维特征空间来增加数据的可分性。该算法能够解决模糊K-均值聚类算法对于非凸形状数据不能正确聚类的问题。  相似文献   

17.
目前常见的轨迹聚类大多基于OPTICS、DBSCAN和K-means等算法,但这些聚类方法的时间复杂度随着轨迹数量的增加会大幅上升。针对该问题,提出一种基于密度核心的轨迹聚类算法。通过引入密度核心的概念,设计轨迹密度计算函数以获取聚类簇的致密核心轨迹,同时利用出租车载客轨迹自身的方向和速度等属性提取轨迹特征点,减少轨迹数据量。在此基础上,根据聚类簇中致密核心轨迹与参与聚类轨迹的相似度距离判断轨迹的匹配程度,进而聚合相似轨迹,并将聚类结果储存在聚类节点中。实验结果表明,与TRACLUS和OPTICS聚类算法相比,该算法能够得到更准确的聚类效果,并且时间效率更高。  相似文献   

18.
针对在蛋白质相互作用网络上的关键蛋白质识别只关注拓扑特性,蛋白质相互作用数据中存在较高比例的假阳性数据以及基于复合物信息的关键蛋白质识别算法对节点的邻域信息和复合物的挖掘对关键蛋白质的识别影响效果考虑不够全面等导致的识别准确率和特异性不高的问题,提出一种基于复合物参与度和密度的关键蛋白质预测算法PEC。首先融合GO注释信息和边聚集系数构造加权PPI网络,克服假阳性对实验结果的影响;基于蛋白质相互作用的边权重,构造相似度矩阵,设计特征值间的最大本征差值来自动确定划分数目K,同时根据加权网络中的蛋白质节点度来选取K个初始聚类中心,进而利用谱聚类结合模糊C-means聚类算法实现复合物的挖掘,提高聚类的准确率,降低数据的维数;其次基于蛋白质节点的复合物参与度以及节点邻域子图密度,设计出关键节点的关键性得分。在DIP和Krogan 2个数据集上,将PEC与DC、BC、CC、SC、IC、PeC、WDC、LIDC、LBCC和UC 10种经典算法相比,实验结果表明,PEC算法能够识别出更多的关键蛋白质,且聚类结果的准确率和特异性较高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号