共查询到20条相似文献,搜索用时 218 毫秒
1.
针对社交网络中用户影响力的评价问题,提出了一种基于SRank的评价算法。基于从社交网络中收集的大规模数据集,结合最近社会学理论研究成果分析PageRank及其改进算法应用于此场景中的不足。在此基础上总结社交网络中信息传播的规律,将用户与社交网络的关系强度定义为用户的人缘值,用来表示用户作为粉丝的信息再传播能力。然后提出了一个通过预测用户信息传播能力大小来分析和度量用户影响力的SRank用户影响力模型。在同样的数据集下相对于PageRank及其改进算法,SRank用户影响力模型获得了更好的影响力预测结果。基于大规模数据的实验结果表明,提出的方法是较为有效的。 相似文献
2.
3.
在已有PageRank算法构建的微博用户影响力评估模型中,存在用户自身属性信息欠缺以及在用户不活跃期间其影响力被误判下降的问题。为此,综合考虑用户自身的属性,基于用户的活跃度、认证信息及博文质量来确定其自身的基本影响力,通过引入用户博文的传播率挖掘用户的潜在影响力,结合用户不同好友的质量,基于改进的PageRank算法构建微博用户影响力评估算法。实验结果表明,与改进BWPR算法相比,该算法准确率、召回率和F值分别提高13.5%、10.1%和12.3%,能准确、客观地反映微博用户的实际影响力,可为社交网络中的意见领袖挖掘、信息传播和舆论引导等研究提供参考。 相似文献
4.
5.
社交网络中重要节点的发现研究具有较大的实际意义与价值。考虑社交网络中用户作为节点所包含一些特有的属性,通过将用户的社交行为划分强/弱关系的方式对社交网络拓扑结构的关系边进行补充,提出一种基于SALSA算法的加权算法WSALSA来发现社交网络中的重要节点。采用部分新浪微博真实数据进行实验及验证,对比PageRank、HITS和SALSA算法得到的节点影响力排序结果在SIR模型中的传播能力,结果表明WSALSA算法与SIR排序结果的斯皮尔曼相关系数值更高,对社交网络中节点重要性的评估更加准确。 相似文献
6.
7.
8.
《计算机应用与软件》2017,(5)
随着Web技术的发展,微博逐渐成为当下最流行的社交平台之一。微博中用户影响力计算是相关研究中的焦点问题。通过对PageRank模型的改进,提出一种新的用户影响力挖掘算法PR4WB(PageRank for Micro Blogs),解决了传统的PageRank算法由于页面权威值的等分传递带来的潜在误差过大的问题。PR4WB算法在考虑微博中用户关系的同时,利用社会网络概念将自身的活跃度、博文质量及可信性加以关联,形成动态的评价模型。基于Twitter数据的实验表明,PR4WB算法能更加准确、客观地反映出用户的实际影响力。 相似文献
9.
现有社交网络影响力优化算法难以发现跨多个社交网络的全局影响力最大节点.对此,利用用户兴趣和跨网络重叠用户对多个社交网络进行研究,提出一种兴趣驱动的跨网络传播模型,设计跨网络影响力的优化算法.实验结果表明,相比现有算法,该算法仅用1/5的种子节点就能达到相同的影响力效果,同时计算时间开销减少了6/7. 相似文献
10.
社交网络作为一种交往方式,已经深入人心。其用户数据在这个大数据时代蕴藏着大量的价值。随着Twitter API的开放,社交网络Twitter俨然成为一个深受欢迎的研究对象,而用户影响力更是其中的研究热点。PageRank算法计算用户影响力已经由来已久,但是它太依赖于用户之间的关注关系,排名不具备时效性。引入用户活跃度的改进PageRank算法,具备一定的时效性,但是不具有足够的说服力和准确性。研究了一种新的基于时间分布用户活跃度的ABP算法,并为不同时段的活跃度加以相应的时效权重因子。最后,以Twitter为研究对象,结合社交关系网,通过实例分析说明ABP算法更具时效性和说服力,可以比较准确地提高活跃用户的排名,降低非活跃用户排名。 相似文献
11.
微博中重要影响力个体的发现有着极为重要的作用。中介中心度方法是发现网络中重要节点的有效方法, 然而传统的中介中心度方法只适用于小规模的网络, 对于海量的微博网络信息却无能为力。提出一种基于随机游走的中介中心度算法, 该算法不仅能有效地应对海量的微博网络数据, 而且其发现结果也明显优于相关的研究。 相似文献
12.
13.
针对社会网络上的影响力最大化算法在大规模网络上难以同时满足传播范围、时间效率和空间效率要求的问题,提出一种混合PageRank和度中心性的启发式算法(MPRD)。首先,基于PageRank,引入一种反向PageRank思想来评估节点影响力;然后,结合局部指标度中心性,设计一种混合的指标来评估节点的最终影响力;最后,通过相似性方法去掉影响力重合严重的节点,选出种子节点集。在6个数据集和两种传播模型上进行实验,实验结果表明,所提的MPRD在传播范围上优于现有的启发式算法,在时间效率上比贪心算法快四、五个数量级,在空间效率上优于基于反向抽样的IMM算法。所提的MPRD在处理大规模网络上的影响力最大化问题时能够取得传播范围、时间效率和空间效率的平衡。 相似文献
14.
对网络实施攻击时,人们希望在有限的资源下获得最大的毁伤效果,而节点排序策略并不能实现毁伤最大.针对这种情况,定义攻击有限节点集的网络毁伤最大化问题,并给出问题的近似求解算法.由于近似求解算法计算复杂度较高,进一步提出基于重要节点的贪婪算法(greedy algorithm based on important nodes,GABIN).对无标度网络的实验表明:GABIN算法能够有效地减少计算时间,且效果接近于近似求解算法;当无标度网络的度指数$\gamma\geqslant2.5$时,GABIN算法的效果明显优于排序算法,所得节点集中超过30%的节点不同于排序算法.对Power网络的毁伤实验表明,GABIN算法适用于较大规模的实际网络,且效果显著优于度、介数、接近度、删除节点等排序算法.实验发现,利用GABIN算法获得的关键节点集包含大量的非中心性节点,这为网络攻击或网络防护提供了一个新的思路. 相似文献
15.
16.
用户影响力度量是影响力最大化问题的核心,与网络拓扑结构相关的影响力度量指标主要分为全局性指标和局部性指标,其中全局性指标需要依靠网络完整拓扑结构计算节点影响力且时间复杂度较高,局部性指标通常忽略或弱化了网络中的自环和多边现象,导致对节点影响力的度量不全面,限制信息最终传播范围。结合三度分隔原理,提出基于局部域的影响力最大化算法。考虑网络中的自环和多边现象,根据网络拓扑结构构建生成图。依据生成图划分每个节点对应的局部域,使用节点在局部域内的影响力近似其在全局范围内的影响力,并据此选择候选种子节点。计算候选种子加入种子集合后的重叠比因子,根据重叠比因子决定是否将此候选种子节点选作种子节点,控制种子集合的影响力重叠程度。在真实数据集上的实验结果表明,与MaxDegree、PageRank等算法相比,该算法能有效识别高影响力节点群体,扩大信息传播范围,且具有较低的时间复杂度。 相似文献
17.
随着社交网络的发展,其节点影响力度量成为一个重要的研究领域。针对传统随机游走PageRank算法精确度不高的问题,提出一种逆向随机游走PageRank算法,该算法采用逆向查找消息传播源的思想,对网络中的每条有向边以概率ε进行逆向随机游走,通过迭代计算出每个节点的PageRank值。实验表明,本文提出的算法较传统的随机游走PageRank算法具有更好的稳定性,并在迭代次数较少时也能保持较高精度。 相似文献
18.
为研究复杂网络的节点重要度及其可靠性,在随机网络、小世界网络和无标度网络模型下,理论分析度值中心性、半局部中心性、介数中心性和PageRank算法在节点重要度评估上的准确性,通过仿真模拟方法,对网络理论模型和实际复杂网络分别进行研究,采用逐步移除节点和重复计算的方式,考察网络最大连通子图和节点移除比例的关系,同时对数值仿真结果进行合理分析。研究结果说明基于网络全局信息的介数中心性和PageRank算法对节点重要度评估的效果更好,同时说明网络的可靠性与网络拓扑结构有关,实际复杂网络一般同时具备多种拓扑特性。 相似文献
19.
Zijun Chen Delong M Yishu Wang Ye Yuan 《International Journal of Software and Informatics》2024,14(1):97-117
Personalized PageRank, as a basic algorithm in large graph analysis, has a wide range of applications in search engines, social recommendation, community detection, and other fields and it has been a hot problem of interest to researchers. The existing distributed personalized PageRank algorithms assume that all data are located in the same geographic location and the network environment is the same among the computing nodes where the data are located. However, in the real world, these data may be distributed in multiple data centers across continents, and these geo-distributed data centers are connected to each other through WANs, which are characterized by heterogeneous network bandwidth, huge hardware differences, and high communication costs. Moreover, the distributed personalized PageRank algorithm requires multiple iterations and random walk on the global graph. Therefore, the existing distributed personalized PageRank algorithms are not applicable to the geo-distributed environment. To address this problem, the GPPR (Geo-distributed Personalized PageRank) algorithm is proposed in this paper. The algorithm first preprocesses the big graph data in the geo-distributed environment and maps the graph data by using a heuristic algorithm to reduce the impact of network bandwidth heterogeneity on the iteration speed of the algorithm. Secondly, GPPR improves the random walk approach and proposes a probability-based push algorithm to further lower the number of iterations required by the algorithm by reducing the bandwidth load of data transmission between working nodes. We implement the GPPR algorithm based on the Spark framework and build a real geo-distributed environment in AliCloud to conduct experiments comparing the GPPR algorithm with several existing representative distributed personalized PageRank algorithms on eight open-source big graph datasets. The results show that the communication data volume of GPPR is reduced by 30% on average in the geo-distributed environment compared with that of other algorithms. In terms of algorithm running efficiency, GPPR improves by an average 2.5 factor compared with other algorithms. 相似文献
20.
个性化PageRank作为大图分析中的的基本算法,在搜索引擎、社交推荐、社区检测等领域具有广泛的应用,一直是研究者们关注的热点问题.现有的分布式个性化PageRank算法均假设所有数据位于同一地理位置,且数据所在的计算节点之间具有相同的网络环境.然而,在现实世界中,这些数据可能分布在跨洲际的多个数据中心中,这些跨域分布(Geo-Distributed)的数据中心之间通过广域网连接,存在网络带宽异构、硬件差异巨大、通信费用高昂等特点.而分布式个性化PageRank算法需要多轮迭代,并在全局图上进行随机游走.因此,现有的分布式个性化PageRank算法不适用于跨域环境.针对此问题,本研究提出了GPPR(Geo-Distributed Personalized PageRank)算法.该算法首先对跨域环境中的大图数据进行预处理,通过采用启发式算法映射图数据,以降低网络带宽异构对算法迭代速度的影响.其次,GPPR改进了随机游走方式,提出了基于概率的push算法,通过减少工作节点之间传输数据的带宽负载,进一步减少算法所需的迭代次数.我们基于Spark框架实现了GPPR算法,并在阿里云中构建真实的跨域环境,在8个开源大图数据上与现有的多个代表性分布式个性化PageRank算法进行了对比实验.结果显示,GPPR的通信数据量在跨域环境中较其他算法平均减少30%.在算法运行效率方面,GPPR较其他算法平均提升2.5倍. 相似文献