首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 625 毫秒
1.
为解决异质信息网络社区发现问题,提出一种基于超图和K-means改进的算法.引入超图对异质网络进行建模,通过DeepWalk的深度随机游走产生节点序列,利用Skip-gram模型将网络节点序列映射到一个低维的向量空间,通过节点向量间距离进行聚类完成社区发现.针对传统K-means在初始聚类中心选择的敏感性问题,提出一种基于密度基尼系数的聚类中心选取方法.在两个真实数据集上进行了实验,实验结果表明,该算法不仅能够完成异质信息网络的社区划分,且社区识别精度高.  相似文献   

2.
高维数据的聚类特性通常难以直接观测. 将其构建为复杂网络, 节点间的拓扑结构可以反映样本之间的关系. 对网络中的节点进行社区发现, 可实现对数据更直观的聚类. 提出一种基于网络社区发现的低随机性标签传播聚类算法. 首先, 用半径和最近邻方法将数据集构建为稀疏的全连通网络. 之后, 根据节点相似度进行节点标签预处理, 使得相似的节点具有相同的标签. 用节点的影响力值改进标签传播过程, 降低标签选择的随机性. 最后, 基于内聚度进行社区的优化合并, 提高社区的质量. 在真实数据集和人工数据集上的实验结果表明, 该算法对各种类型的数据都具有较好的适应性.  相似文献   

3.
杨煜  段威威 《计算机应用》2023,(10):3129-3135
动态社区发现研究是社交网络分析(SNA)的重要研究领域。随着节点加入或离开社交网络,节点间的关系也随之建立或消失,进而影响着社区结构的变化。针对社交网络静态社区发现算法缺少必要的社区节点历史信息而导致的网络结构分析、聚类信息不足和计算开销过大的问题,基于社区网络演化事件的划分并根据主要社区事件的分析,提出一种基于谱聚类的动态社区发现算法(SC-DCDA)。首先,根据实验观察使用谱映射的方法将高维数据降维,并采用改进的模糊C-均值聚类(FCM)算法确定动态社交网络中的节点与待发现社区的关联度;其次,根据演化相似度矩阵分析社区结构。通过使用真实网络数据集以及模块度得分、轮廓系数等社区发现算法衡量指标,评估所提算法的效果。实验结果表明,SC-DCDA的计算开销相较于传统谱聚类降低了8.37%,在所有数据集上的平均模块度得分是0.49,其他衡量指标的定性分析结果也较好,验证了所提算法在信息交互、聚类效果和精确度上表现较好。  相似文献   

4.
随着大数据时代的到来,复杂网络的社区发现已成为一个重要研究方向。层次聚类算法作为社区发现的经典算法受到了广泛应用,然而该算法具有较高的时间复杂度和较低的运行效率。为提高社区发现算法的运行效率,提出了一种基于节点相似度的半监督社区发现新算法--SSGN算法。充分利用先验知识must-link、cannot-link约束集合,将先验信息通过衍生规则进行扩展,并对扩展的信息通过基于距离度量的方式加以验证。采用人工网络和真实网络进行验证,UCI 数据集和大型真实数据集上的实验结果表明, 基于节点相似度的半监督社区发现算法较其他半监督聚类算法更准确,也更高效。  相似文献   

5.
经典的无监督聚类算法快速、简单且可以直接对大规模数据集进行划分,但是由于网络结构较为复杂,划分的准确度并不高。为此,提出一种基于主动学习的纠错式半监督社区发现算法ESCD(error correction semi-supervised community detection algorithm),将传统的K-means算法进行分步计算,并且在聚类的过程中加入成对约束。根据先验信息保留正确的划分,纠正错误的划分来改变网络的连接关系,使网络具有更明显的块结构,当节点与聚类中心的距离不再变化时划分结束。实验结果表明,与现有的社区发现算法相比,ESCD算法具有更高的精度,且所需的监督信息远远小于其他半监督算法。  相似文献   

6.
近年来,随着各种网络应用平台愈演愈烈,多种关系网络中用户之间往往存在大量相似的局部社区结构. 鉴于传统单视角社区发现算法在划分时无法同时考虑多种因素,本文将在多视角原理上提出一种基于局部协同选择聚类的多视角社区发现模型,该模型中主要解决了传统多视角聚类算法的条件限制问题(节点,聚类个数和充分的属性信息)和过度调整问题. 首先,构建选择调节矩阵来训练各视角中的共同部分节点集,并集成其共同节点的社团结构,然后,构建局部优化矩阵将共同节点结构做为训练集,利用核岭回归(KRR)原理完成各视角中孤立节点的划分,最后通过UCI数据集和DBLP数据集来分别验证聚类精度和算法适用性.  相似文献   

7.
一种协同的可能性模糊聚类算法   总被引:1,自引:0,他引:1  
模糊C-均值聚类(FCM)对噪声数据敏感和可能性C-均值聚类(PCM)对初始中心非常敏感易导致一致性聚类。协同聚类算法利用不同特征子集之间的协同关系并与其他算法相结合,可提高原有的聚类性能。对此,在可能性C-均值聚类算法(PCM)基础上将其与协同聚类算法相结合,提出一种协同的可能性C-均值模糊聚类算法(C-FCM)。该算法在改进的PCM的基础上,提高了对数据集的聚类效果。在对数据集Wine和Iris进行测试的结果表明,该方法优于PCM算法,说明该算法的有效性。  相似文献   

8.
可能性C均值聚类算法(Possibilistic C-Means,PCM)相比于模糊C均值聚类算法(Fuzzy C-Means,FCM),能更好地处理含有噪音和例外点的数据,但在处理数据粘性较强的数据集时,PCM算法的聚类中心趋于一致,从而导致聚类算法直接失效。针对这个问题,提出了中心约束准则与跨域迁移学习准则,并将其应用到可能性C均值算法中,从而提出一种具有中心约束能力的聚类算法,简称中心约束的跨源学习聚类算法,改进后的算法能够利用跨域知识进行辅助聚类,确保类中心相互远离,从而能够保证算法的聚类性能。通过模拟数据集和真实数据集的实验,验证了该算法的上述优点。  相似文献   

9.
杜航原  裴希亚  王文剑 《计算机应用》2019,39(11):3151-3157
针对现实世界的网络节点中包含大量属性信息并且社区之间呈现出重叠特性的问题,提出了一种面向属性网络的重叠社区发现算法。融合网络的拓扑结构和节点属性定义了节点的密集度和间隔度,分别用于描述社区内部连接紧密和外部连接松散的特点。基于密度峰值聚类的思想搜索局部密度中心作为社区中心,在此基础上给出了非中心节点关于各个社区的隶属度的迭代计算方法,实现了重叠社区的划分。在真实数据集上进行了仿真实验,实验结果表明所提算法相对于LINK、COPRA和DPSCD能获得更好的社区划分结果。  相似文献   

10.
标签传播算法(LPA)是一种高效地处理大规模网络的社区发现算法,由于其近乎线性的时间复杂度而受到广泛关注。然而,该算法每个节点的标签依赖于其邻居节点,其迭代速度和聚类有效性对标签信息的更新顺序非常敏感,影响了社区发现结果的准确性和稳定性。基于该问题,提出了一种基于加权聚类集成的标签传播算法。该算法利用多次标签传播算法的结果作为基聚类集,并用模块度评估每个基聚类的重要性,使其作为节点相似性度量的权值形成加权相似性矩阵,最后通过层次聚类得出最终的社区划分结果。在实验分析中,该算法和其他5个具有代表性的标签传播算法的改进算法在真实数据集上进行了比较,展示了新算法能有效地提高标签传播算法的社区发现精度。  相似文献   

11.
针对目前多层社会网络(multi-layered social network, MSN)的社团发现算法较少、社团划分结果较粗糙等特点, 提出了一种基于边聚类的多层社会网络社团发现(CLEDCC)算法。该算法综合考虑每层关系网中的任意两节点邻居及节点本身的关系强弱, 并分别针对人造稀疏网、稠密网以及真实数据集进行仿真。实验表明, 所提出的CLEDCC算法能有效地避免参数不确定性问题, 并比跨层边聚类系数(CLECC)算法的社团划分结果更精准。  相似文献   

12.
针对传统社区发现算法多数是基于单一关系的同构学术社会网络,而包含多种关系的异构学术网络社区发现算法还不多的情况,提出一种基于FCM(Fuzzy c-means)和结构洞的学术社区发现算法—HAFCD算法。从构建基于DBWorld邮件数据的异构学术网络出发,通过分析异构网络中的多种关联关系和节点内容的相似性,提出改进的语义路径模型,计算评审人间的相似度。基于此,该算法根据结构洞越少,网络闭合性越高这一事实,将结构洞理论融入FCM算法,进行异构学术社区发现。通过与现有的谱聚类和路径选择聚类算法进行实验比较表明,本算法具有较好的计算效果。  相似文献   

13.
随着互联网和社会的发展,各个领域每天都会产生大量相互关联、彼此依赖的数据,这些数据根据不同的主题形成了各种复杂网络。挖掘社区结构是复杂网络领域中的一项重要研究内容,因为其在推荐系统、行为预测和信息传播等方面具有极其重要的意义。社区结构中的重叠社区结构在生活中普遍存在,更具有实际研究意义。为有效发现复杂网络中的重叠社区,文中引入了粗糙集理论对社区进行分析,识别出重叠节点,进而提出了一种基于粗糙集和密度峰值的重叠社区发现方法OCDRD(Overlapping Community Detection Algorithm Based on Rough Sets and Density Peaks)。该方法在传统网络节点局部相似性度量的基础上,结合灰色关联分析方法求出网络节点间的全局相似性,进而将其转化为节点间距离。将密度峰值聚类算法的思想应用于该算法中,以根据网络结构自动选取社区中心节点。依据网络中节点的距离比例关系,定义了社区的上近似、下近似以及边界域。最后,不断调整距离比率阈值并进行划分迭代,在每次迭代中针对社区的边界域进行计算,从而获得最佳重叠社区划分结构。在LFR基准人工网络数据集和真实网络数据集上,基于标准互信息(Normalized Mutual Information,NMI)和具有重叠性模块度EQ这两个评价指标,将OCDRD方法与近几年效果较好的其他社区发现算法进行测试比较。实验结果显示,OCDRD方法在社区划分结构方面整体优于其他社区发现算法,表明了该算法的可行性和有效性。  相似文献   

14.
网络,数学家们称其为图,它为许多复杂系统的结构提供了一个很好的抽象,从社会网络、计算机网络,到生物网络以及物理系统的状态空间。在过去的几十年里出现了许多确定网络系统拓扑结构的改进实验,但对实验产生的数据进行科学的分析,仍然存在本质的挑战。目前的社团检测中主要存在两个问题:一是不知道网络中有几个社团;二是网络中的顶点可能属于不同的社团,也就是社团中存在重叠结构。为了了解各种重叠社团检测算法的思想、实现步骤、优缺点比较、算法应用,文中对邻域重叠社团检测算法进行了深入的分析,以k-means算法分析了经济网络,同时采用Silhouette指标解决了最佳聚类数的问题,并通过仿真实验证明了此算法的可能性。  相似文献   

15.
现实世界存在大量二分网络,研究二分社区结构有助于从新角度认识和理解复杂网络。由于二分网络特殊的二分结构,使得基于单模网络的现有社区发现算法无法适用。本文提出一种基于Kullback-Leibler距离的二分网络社区发现算法,该算法将异质节点间的连接关系转化为其在用户节点集上的连接概率分布,并建立基于概率分布的KL相似度衡量节点连接模式的差异性,从而克服二分结构对节点相似性评估的不利影响,实现对二分网络异质节点的社区发现。在人工网络和真实网络上的实验和分析表明:该算法能够有效挖掘二分网络社区结构,改善二分网络社区发现的准确性和效率。  相似文献   

16.
社区发现算法对分析复杂网络的拓扑和层次结构、预测复杂网络的演化趋势等具有十分重要的意义.传统的社区发现算法划分精度不高,忽略了网络嵌入的重要性.针对这样的问题,提出了基于节点相似性和网络嵌入Node2Vec方法的无参数社区发现算法.首先,使用网络嵌入Node2Vec方法将网络节点映射成欧氏空间中低维向量表示的数据点,计...  相似文献   

17.
传统的社区挖掘以社区为单位,忽略了社区内部成员的性质和地位。为了提高社区挖掘的精度,为个性化推荐提供一个优化的基础平台,基于优先情节和增长定律,提出了一种新颖的动态角色挖掘算法。首先根据节点的度数分布逆向推导社会网络的形成演化机制,构造网络时间轴;然后根据时间轴逐步向网络中添加新节点,同时进行社区挖掘和角色划分。在人工网络和真实世界网络上进行了多次测试,并与G-N算法进行了比较,取得了较好的结果。实验证明,应用动态角色挖掘算法得到的社区都是强连通社区,具有较高的准确性和实用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号