首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 204 毫秒
1.
王家龙  杨杰  周丽华  王丽珍  王睿康 《软件学报》2023,34(10):4830-4850
社区是信息网络的重要属性, 社区搜索旨在寻找满足用户给定条件的节点集合, 是信息网络分析的重要研究内容. 异质信息网络由于包含更加全面、丰富的结构和语义信息, 所以异质信息网络的社区搜索近年来受到人们的广泛关注. 针对现有异质信息网络的社区搜索方法难以满足复杂条件社区搜索要求的不足, 定义了复杂条件社区搜索问题, 提出了考虑非对称元路径、受限元路径和禁止节点约束的搜索算法. 3种算法分别通过元路径补全策略、调整带标签的批量搜索策略和拆分复杂搜索条件的方式搜索社区, 同时针对禁止节点约束的搜索算法设计了基于剪枝策略和近似策略的优化算法以提高搜索效率. 在真实数据集上进行了大量实验, 实验结果证明了所提算法的有效性和高效性.  相似文献   

2.
针对已有社区搜索算法采用高维稀疏向量表示节点时间复杂度高的问题,提出一种基于节点嵌入表示学习的社区搜索算法CSNERL.节点嵌入技术能够直接从网络结构中学习节点的低维实值向量表示,为社区搜索提供了新思路.首先,针对已有节点嵌入算法存在较高概率在最亲近邻居间来回游走的问题,提出基于最亲近邻居但不立即回访随机游走的节点嵌入模型NECRWNR,采用NECRWNR模型学习节点的特征向量表示;然后,采用社区内所有节点的向量均值作为社区的向量表示,通过选择与当前社区距离最近的节点加入社区的方法实现一种新的社区搜索算法.在真实网络和模拟网络数据集上分别与相关的社区搜索算法进行实验对比,结果表明所提出社区搜索算法CSNERL具有更高的准确性.  相似文献   

3.
佘鑫  何震瀛 《计算机工程》2021,47(12):54-61,70
现有的社区搜索算法难以在网络中找到满足给定复杂属性条件的社区。同时,随着网络规模的不断扩大,单机串行的社区搜索算法也已无法有效地处理大规模的网络数据。针对复杂属性条件下的clique社区搜索问题,提出一种基于Spark的搜索算法。在Spark并行计算框架的基础上,结合图的结构特征和内容属性,根据由布尔表达式定义的复杂属性条件采取不同的搜索策略,搜索时利用属性的搜索成本和扩展成本进行局部优化,从而加快搜索过程。实验结果表明,与结构优先或属性优先的社区搜索算法相比,该算法在不同属性条件、网络规模和节点数目的情况下均能保证搜索准确性并提高搜索效率。  相似文献   

4.
现实生活中的网络通常存在社区结构,社区查询是图数据挖掘的基本任务.现有研究工作提出了多种模型来识别网络中的社区,如基于k-核的模型和基于k-truss的模型.然而,这些模型通常只限制社区内节点或边的邻居数量,忽略了邻居之间的关系,即节点的邻域结构,从而导致社区内节点的局部稠密性较低.针对这一问题,本文将节点的邻域结构信息融入k-核稠密子图中,提出一种新的基于邻域连通k-核的社区模型,并定义了社区的稠密度.基于这一新模型,研究了最稠密单社区搜索问题,即返回包含查询节点集且具有最高稠密度的社区.在现实生活图数据中,一组查询节点可能会分布在多个不相交的社区中.为此,本文进一步研究了基于稠密度阈值的多社区搜索问题,即返回包含查询节点集的多个社区,且每个社区的稠密度不低于用户指定的阈值.针对最稠密单社区搜索和基于稠密度阈值的多社区搜索问题,首先定义了边稠密度的概念,并提出了基于边稠密度的基线算法.为了提高搜索效率,设计了索引树和改进索引树结构,能够支持在多项式时间内返回查询结果.通过与基线算法在多组数据集上的对比,验证了基于邻域连通k-核的社区模型的有效性和所提出查询算法的效率.  相似文献   

5.
社区搜索旨在从网络中查找给定查询节点所在的局部社区,基于谱的社区搜索方法是流行的方法之一。现有基于谱的社区搜索方法多面向简单网络而无法处理具有2类实体关联的二分网络,且面向二分网络的社区挖掘方法多是对网络进行整体划分。据此,提出了面向二分网络的谱近似社区搜索方法,旨在将谱方法引入到二分网络中进而精确定位与查询节点关联紧密的社区。具体来说,首先考虑二分网络中2类实体的关联,基于局部模块度设计了面向二分网络的局部模块度;其次,基于谱图理论,在二分网络上利用融合不同实体关联的模块度矩阵局部逼近特征子空间,设计了适用于二分网络的谱方法;最后,利用结合谱性质的二分网络上的局部模块度,设计了谱子空间中以查询节点集为支撑的稀疏指示向量的线性规划问题,目标社区可通过线性规划问题的求解而获得。真实数据集上的实验结果表明了本文方法有效性和效率。  相似文献   

6.
为解决P2P社区的资源定位及信息检索问题,采用混合型P2P网络模型,将社区内的检索划分为本地检索、组内搜索和组间搜索。对于本地检索设计了新的词条权重的计算方法,解决了同构文档集内的文本检索问题。对于组内搜索和组间搜索,通过设计节点选择策略,使一部分与查询相关度高的节点执行查询任务。最后提出结果融合的方法并对特定的实验数据进行测试,实验表明设计的算法在较小的查询开销下,能取得较好的检索效果。  相似文献   

7.
时序网络中的社区搜索问题旨在寻找符合一定时序规律的社区.短时交互特性作为时序网络的一种重要时序特征,相比于长期社区更具研究价值,可用于有效挖掘网络中核心的时序紧密结构.现有工作大多研究了时序社区的持续性、突变性、周期性等现象,尚无法建模时序社区的短时特性.针对现有工作难以满足上述需求的现状,提出top-k短时社区搜索这一新问题,为有效发现复杂网络中短时紧密社区提供新的解决思路.首先,针对时序网络中社区的短时特性,提出了δ-短时社区的形式化定义用以刻画短时社区结构.同时,给出了不同时间交互下形成的时序社区的时间跨度计算方式,为衡量短时社区提供一个具体的量化指标.其次,提出了top-kδ-短时社区搜索算法ShrimeCS,分析并讨论了短时社区的判断条件分别用以判断最小δ-短时社区和top-kδ-短时社区,并提出了δ-基本块结构结合判断条件用以找到最小δ-短时社区.此外,进一步提出了强δ-基本块结构以避免在扩展过程中出现子图冗余,从而降低搜索过程的时间开销.还分析了top-kδ-短时社区搜索过程中基于全局时间跨度上界与渐进时间跨度上界优化的启发式计算方法,以进一步加快算法运行效率,搜索优化率相比原算法提高64.2%以上.然后,在5个真实数据集和3个合成数据集上进行了实验,并提出了聚集因子指标用以评估时序社区中成员交互时间的接近程度.实验结果显示,ShrimeCS找到社区的短时性优于基准方法,基于全局时间跨度和渐进时间跨度上界优化可以降低17.16%以上的时间开销.在真实场景中的案例研究表明,ShrimeCS找到的top-kδ-短时社区可以捕捉到社区中时间跨度的变化,可以用来探索社区随时间的演化情况.最后,验证了所提方法的正确性,并表明ShrimeCS算法具有较好的可扩展性.  相似文献   

8.
社区云计算环境中的一种数据分布及搜索策略   总被引:1,自引:0,他引:1  
业务数据搜索是商业社区云面向云用户或第三方应用提供的基本服务,在动态、开放的社区云环境中,业务数据更为复杂,商业目标对数据搜索服务也提出了更高的要求.以面向旅游的社区云为背景,讨论一种透明、虚拟化的商业数据搜索服务的实现方法,基本思想是在构成社区云的服务节点中引入相似节点簇和等价节点簇两种虚拟节点簇模型,并分别给出其更新算法,使数据在云中的服务节点之间动态、自主地调整以趋于合理分布;然后,提出一种基于上述模型的3-阶段数据搜索策略.模拟实验表明,以此方法为核心的数据搜索服务,在数据搜索质量、效率和服务节点负载均衡等方面能够获得预期效果,满足社区云环境对数据搜索服务提出的商业目标.  相似文献   

9.
属性图中的社区搜索是一种局部社区发现方法,本质是基于用户提供的查询节点返回包含查询节点且在结构内聚的同时属性与查询属性相似的个性化子图.该任务有助于用户更好地理解社区是如何形成的以及社区形成的原因.提出了一种融合结构-属性交互二部图随机游走机制,有效地支持属性图中的社区搜索.具体地,首先基于网络拓扑结构构建结构概率转移矩阵;其次探索结构与属性交互形成的二部图定义2阶段的节点-属性-节点概率转移矩阵,将其与结构概率转移矩阵有效融合得到属性图的概率转移矩阵;最后设计重启随机游走方法,基于融合结构和属性的并行电导值精准查询社区.在真实数据集和人工数据集上的实验表明了本文方法的有效性.  相似文献   

10.
成其伟  陈启买  贺超波  刘海 《计算机应用》2005,40(11):3203-3210
针对复杂网络社区结构具有重叠性的问题,目前已提出许多不同类型的解决方法,其中基于对称二值非负矩阵分解(SBNMF)的重叠社区发现方法是具有代表性的方法。然而,SBNMF在面对社区内部链接稀疏的网络时,其重叠社区发现性能低下,为此提出一种基于改进SBNMF(ISBNMF)的重叠社区发现方法。首先利用对称非负矩阵分解得到的因子矩阵构建社区内部链接稠密的新网络,然后再使用基于Frobenius范数的SBNMF模型对新网络的邻接矩阵进行分解,最后通过网格搜索法或梯度下降法得到可以显式指示节点的社区隶属关系的二值矩阵。在人工合成的和真实的网络数据集上进行大量实验,结果表明ISBNMF的社区发现性能优于SBNMF和其他代表性方法。  相似文献   

11.
Community search is an important problem in network analysis, which has attracted much attention in recent years. As a query-oriented variant of community detection problem, community search starts with some given nodes, pays more attention to local network structures, and gets personalized resultant communities quickly. The existing community search method typically returns a single target community containing query nodes by default. This is a strict requirement and does not allow much flexibility. In many real-world applications, however, query nodes are expected to be located in multiple communities with different semantics. To address this limitation of existing methods, an efficient spectral-based Multi-Scale Community Search method (MSCS) is proposed, which can simultaneously identify the multi-scale target local communities to which query node belong. In MSCS, each node is equipped with a graph Fourier multiplier operator. The access of the graph Fourier multiplier operator helps nodes to obtain feature representations at various community scales. In addition, an efficient algorithm is proposed for avoiding the large number of matrix operations due to spectral methods. Comprehensive experimental evaluations on a variety of real-world datasets demonstrate the effectiveness and efficiency of the proposed method.  相似文献   

12.
社区检测是复杂网络分析的重要研究任务之一,其检测结果有助于人们深入理解复杂网络的社区结构,同时为下游任务提供支持,如内容推荐、链路检测等.针对复杂网络的社区检测问题,提出了一种基于标签传播的两阶段社区检测算法——TS-LPA.TS-LPA采用扩展邻域的思想来量化节点的传播能力,并在此基础上,利用节点信息和网络中边的权重...  相似文献   

13.
梁宗文  杨帆  李建平 《计算机应用》2015,35(5):1213-1217
针对复杂网络结构划分过程复杂、准确性差的问题,定义了节点全局和局部相似性衡量指标,并构建节点的相似性矩阵,提出一种基于节点相似性度量的社团结构划分算法.其基本思路是将节点(或社团)按相似性合并条件划分到同一个社团中,如果合并后的节点(或社团)仍然满足相似性合并条件,则继续合并,直到所有节点都得到准确的社团划分.实验结果表明,所提算法能成功正确地划分出真实网络中的社团结构, 性能比标签传播算法(LPA)、GN(Girvan-Newman)、CNM(Clauset-Newman-Moore)等算法优秀,能有效提高结果的准确性和鲁棒性.  相似文献   

14.
局部搜索与遗传算法结合的大规模复杂网络社区探测   总被引:6,自引:2,他引:4  
基于遗传算法的复杂网络社区探测是当前的研究热点. 针对该问题,本文在分析网络模块性函数Q的局部单调性的基础上, 给出一种快速、有效的局部搜索变异策略, 同时为兼顾初始种群的精度和多样性以达到进一步提高搜索效率的目的, 采用了标签传播作为初始种群的产生方法;综上,提出了一个结合局部搜索的遗传算法(Genetic algorithm with local search, LGA). 在基准网络及大规模复杂网络上对LGA进行测试, 并与当前具有代表性的社区探测算法进行比较, 实验结果表明了文中算法的有效性与高效性.  相似文献   

15.
对于PageRank方法结果过于集中,未考虑复杂网络社区结构特性的问题,提出了一种改进的,基于复杂网络社区划分的节点重要性排序方法CD-PR。根据标签传播算法(LPA)对复杂网络进行社区划分的结果,将社区的内外连接关系转化为社区选择的概率表示;按照社区选择概率,分别从各个社区提取一定比例的候选关键节点;将这些候选节点重新排序,得到关键节点排序结果。以4个真实复杂网络作为实验数据,与现有算法进行对比,进行SIR传播性能实验。实验结果表明,CD-PR算法筛选出的节点在整体传播性能上具有更好的效果,CD-PR算法可以有效地对复杂网络的节点进行重要性排序。  相似文献   

16.
成其伟  陈启买  贺超波  刘海 《计算机应用》2020,40(11):3203-3210
针对复杂网络社区结构具有重叠性的问题,目前已提出许多不同类型的解决方法,其中基于对称二值非负矩阵分解(SBNMF)的重叠社区发现方法是具有代表性的方法。然而,SBNMF在面对社区内部链接稀疏的网络时,其重叠社区发现性能低下,为此提出一种基于改进SBNMF(ISBNMF)的重叠社区发现方法。首先利用对称非负矩阵分解得到的因子矩阵构建社区内部链接稠密的新网络,然后再使用基于Frobenius范数的SBNMF模型对新网络的邻接矩阵进行分解,最后通过网格搜索法或梯度下降法得到可以显式指示节点的社区隶属关系的二值矩阵。在人工合成的和真实的网络数据集上进行大量实验,结果表明ISBNMF的社区发现性能优于SBNMF和其他代表性方法。  相似文献   

17.
社区划分一直是复杂网络研究中的一个热门话题,社区的快速准确划分为研究复杂网络的性质提供了良好的基础。传统的社区发现方法都是在全局复杂网络的基础上进行社区划分,随着网络中节点的增加,网络规模的变大,社区发现变得更为复杂。提出了一种局部社区发现算法,该算法无需知道整个复杂网络的全部信息,只需从一个待求节点出发,考察其与邻接节点的紧密程度,逐步将邻接点添加到社区中,得到该节点所在的社区结构。同时,该算法还可实现全局网络的社区发现。利用该算法分别对Zachary空手道俱乐部网络和海豚社会网络进行社区发现,实验结果表明了该算法的准确性与可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号