首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
针对社交网络中用户影响力的评价问题,提出了一种基于SRank的评价算法。基于从社交网络中收集的大规模数据集,结合最近社会学理论研究成果分析PageRank及其改进算法应用于此场景中的不足。在此基础上总结社交网络中信息传播的规律,将用户与社交网络的关系强度定义为用户的人缘值,用来表示用户作为粉丝的信息再传播能力。然后提出了一个通过预测用户信息传播能力大小来分析和度量用户影响力的SRank用户影响力模型。在同样的数据集下相对于PageRank及其改进算法,SRank用户影响力模型获得了更好的影响力预测结果。基于大规模数据的实验结果表明,提出的方法是较为有效的。  相似文献   

2.
意见领袖是网络社区中积极的信息传播者和信息引导者,对其影响力的评估是社交网络分析的一项重要内容。针对现有算法对用户动态行为分析和动态内容影响考虑欠缺而不能客观反映真实情况的问题,提出一种基于用户影响力和PageRank的意见领袖发现算法,综合考虑用户自身影响力、用户动态行为影响度和用户行为给动态内容带来的真实影响。通过从知乎网络社区收集的大规模数据实验结果表明,该算法更具合理性并能有效地提高网络社区意见领袖的识别准确度。  相似文献   

3.
在已有PageRank算法构建的微博用户影响力评估模型中,存在用户自身属性信息欠缺以及在用户不活跃期间其影响力被误判下降的问题。为此,综合考虑用户自身的属性,基于用户的活跃度、认证信息及博文质量来确定其自身的基本影响力,通过引入用户博文的传播率挖掘用户的潜在影响力,结合用户不同好友的质量,基于改进的PageRank算法构建微博用户影响力评估算法。实验结果表明,与改进BWPR算法相比,该算法准确率、召回率和F值分别提高13.5%、10.1%和12.3%,能准确、客观地反映微博用户的实际影响力,可为社交网络中的意见领袖挖掘、信息传播和舆论引导等研究提供参考。  相似文献   

4.
利用社交网络大数据进行用户影响力分析,有助于识别网络环境中影响力强的用户以实现其社会和商业价值。传统方法无法高效处理海量社交网络数据,定量准确地分析用户影响力。为解决该问题,本文提出一种基于PageRank算法的改进的用户影响力评价模型,综合考虑了用户连接程度和活跃程度,并以支持大规模并行图计算的Spark GraphX为工具,快速高效地实现了微博用户影响力的定量分析与评价。实验结果表明,本文所提方法效率更高,得到的用户影响力结果更接近真实情况。  相似文献   

5.
社交网络中重要节点的发现研究具有较大的实际意义与价值。考虑社交网络中用户作为节点所包含一些特有的属性,通过将用户的社交行为划分强/弱关系的方式对社交网络拓扑结构的关系边进行补充,提出一种基于SALSA算法的加权算法WSALSA来发现社交网络中的重要节点。采用部分新浪微博真实数据进行实验及验证,对比PageRank、HITS和SALSA算法得到的节点影响力排序结果在SIR模型中的传播能力,结果表明WSALSA算法与SIR排序结果的斯皮尔曼相关系数值更高,对社交网络中节点重要性的评估更加准确。  相似文献   

6.
《计算机工程》2017,(5):179-184
针对传统PageRank算法存在主题漂移、网页权值均分等问题,提出一种改进的PageRank算法。为提高用户查询效率和搜索质量,结合时间反馈因子对用户转发、用户评论和微博提及行为进行综合分析,采用统计分析方法对用户行为在微博用户影响力排序中的贡献进行度量,并利用改进的TF-IDF算法计算主题相似度权值使用户能够选择相关度较高的网页,从而获得相对应的PageRank权值。实验结果表明,与微博常用排序算法相比,改进PageRank算法具有更好的用户影响力排序效果。  相似文献   

7.
通过对微博客的信息传播网络进行分析和测量,从区域信息传播的角度出发,研究了微博信息传播的微观过程。通过真实测量用户的信息传播行为,构建了信息收听网络和信息转发网络模型。通过实测数据发现,在区域信息传播中少量核心节点覆盖了主要的网络信息传播行为。针对这些核心节点,提出了一种类PageRank算法的Weibo-Rank用户传播影响力识别算法,提出了基于真实测量的信息传播覆盖率的评价指标,并通过与多种社会性传统用户影响力分析算法进行对比,实证了该算法的有效性和准确性。  相似文献   

8.
随着Web技术的发展,微博逐渐成为当下最流行的社交平台之一。微博中用户影响力计算是相关研究中的焦点问题。通过对PageRank模型的改进,提出一种新的用户影响力挖掘算法PR4WB(PageRank for Micro Blogs),解决了传统的PageRank算法由于页面权威值的等分传递带来的潜在误差过大的问题。PR4WB算法在考虑微博中用户关系的同时,利用社会网络概念将自身的活跃度、博文质量及可信性加以关联,形成动态的评价模型。基于Twitter数据的实验表明,PR4WB算法能更加准确、客观地反映出用户的实际影响力。  相似文献   

9.
现有社交网络影响力优化算法难以发现跨多个社交网络的全局影响力最大节点.对此,利用用户兴趣和跨网络重叠用户对多个社交网络进行研究,提出一种兴趣驱动的跨网络传播模型,设计跨网络影响力的优化算法.实验结果表明,相比现有算法,该算法仅用1/5的种子节点就能达到相同的影响力效果,同时计算时间开销减少了6/7.  相似文献   

10.
社交网络作为一种交往方式,已经深入人心。其用户数据在这个大数据时代蕴藏着大量的价值。随着Twitter API的开放,社交网络Twitter俨然成为一个深受欢迎的研究对象,而用户影响力更是其中的研究热点。PageRank算法计算用户影响力已经由来已久,但是它太依赖于用户之间的关注关系,排名不具备时效性。引入用户活跃度的改进PageRank算法,具备一定的时效性,但是不具有足够的说服力和准确性。研究了一种新的基于时间分布用户活跃度的ABP算法,并为不同时段的活跃度加以相应的时效权重因子。最后,以Twitter为研究对象,结合社交关系网,通过实例分析说明ABP算法更具时效性和说服力,可以比较准确地提高活跃用户的排名,降低非活跃用户排名。  相似文献   

11.
微博中重要影响力个体的发现有着极为重要的作用。中介中心度方法是发现网络中重要节点的有效方法, 然而传统的中介中心度方法只适用于小规模的网络, 对于海量的微博网络信息却无能为力。提出一种基于随机游走的中介中心度算法, 该算法不仅能有效地应对海量的微博网络数据, 而且其发现结果也明显优于相关的研究。  相似文献   

12.
微博已成为主流的在线社交网络平台,用户的影响力已成为衡量用户价值的一个重要指标。本文基于PageRank算法,通过分析用户之间的兴趣相似度、相对发帖活跃度、相互反馈互动程度来计算一个用户对其所关注的用户的关注程度,提出一个能够评估用户在微博上实际影响度WeiboRank算法。实验数据分析表明,该算法得到的用户影响度值能较客观地反映用户在其所处的虚拟社交网络中的实际影响度。  相似文献   

13.
针对社会网络上的影响力最大化算法在大规模网络上难以同时满足传播范围、时间效率和空间效率要求的问题,提出一种混合PageRank和度中心性的启发式算法(MPRD)。首先,基于PageRank,引入一种反向PageRank思想来评估节点影响力;然后,结合局部指标度中心性,设计一种混合的指标来评估节点的最终影响力;最后,通过相似性方法去掉影响力重合严重的节点,选出种子节点集。在6个数据集和两种传播模型上进行实验,实验结果表明,所提的MPRD在传播范围上优于现有的启发式算法,在时间效率上比贪心算法快四、五个数量级,在空间效率上优于基于反向抽样的IMM算法。所提的MPRD在处理大规模网络上的影响力最大化问题时能够取得传播范围、时间效率和空间效率的平衡。  相似文献   

14.
对网络实施攻击时,人们希望在有限的资源下获得最大的毁伤效果,而节点排序策略并不能实现毁伤最大.针对这种情况,定义攻击有限节点集的网络毁伤最大化问题,并给出问题的近似求解算法.由于近似求解算法计算复杂度较高,进一步提出基于重要节点的贪婪算法(greedy algorithm based on important nodes,GABIN).对无标度网络的实验表明:GABIN算法能够有效地减少计算时间,且效果接近于近似求解算法;当无标度网络的度指数$\gamma\geqslant2.5$时,GABIN算法的效果明显优于排序算法,所得节点集中超过30%的节点不同于排序算法.对Power网络的毁伤实验表明,GABIN算法适用于较大规模的实际网络,且效果显著优于度、介数、接近度、删除节点等排序算法.实验发现,利用GABIN算法获得的关键节点集包含大量的非中心性节点,这为网络攻击或网络防护提供了一个新的思路.  相似文献   

15.
针对异质信息网络中的影响力最大化(IM)问题,提出了一种基于有向无环图(DAG)的影响力最大化算法(DAGIM).首先基于DAG结构度量节点的影响力,然后采用边际增益策略选择影响力最大的节点.DAG结构表达力强,不仅描述了不同类型节点之间的显性关系,也刻画了节点之间的隐性关系,较完整地保留了网络的异质信息.在三个真实数...  相似文献   

16.
用户影响力度量是影响力最大化问题的核心,与网络拓扑结构相关的影响力度量指标主要分为全局性指标和局部性指标,其中全局性指标需要依靠网络完整拓扑结构计算节点影响力且时间复杂度较高,局部性指标通常忽略或弱化了网络中的自环和多边现象,导致对节点影响力的度量不全面,限制信息最终传播范围。结合三度分隔原理,提出基于局部域的影响力最大化算法。考虑网络中的自环和多边现象,根据网络拓扑结构构建生成图。依据生成图划分每个节点对应的局部域,使用节点在局部域内的影响力近似其在全局范围内的影响力,并据此选择候选种子节点。计算候选种子加入种子集合后的重叠比因子,根据重叠比因子决定是否将此候选种子节点选作种子节点,控制种子集合的影响力重叠程度。在真实数据集上的实验结果表明,与MaxDegree、PageRank等算法相比,该算法能有效识别高影响力节点群体,扩大信息传播范围,且具有较低的时间复杂度。  相似文献   

17.
随着社交网络的发展,其节点影响力度量成为一个重要的研究领域。针对传统随机游走PageRank算法精确度不高的问题,提出一种逆向随机游走PageRank算法,该算法采用逆向查找消息传播源的思想,对网络中的每条有向边以概率ε进行逆向随机游走,通过迭代计算出每个节点的PageRank值。实验表明,本文提出的算法较传统的随机游走PageRank算法具有更好的稳定性,并在迭代次数较少时也能保持较高精度。  相似文献   

18.
为研究复杂网络的节点重要度及其可靠性,在随机网络、小世界网络和无标度网络模型下,理论分析度值中心性、半局部中心性、介数中心性和PageRank算法在节点重要度评估上的准确性,通过仿真模拟方法,对网络理论模型和实际复杂网络分别进行研究,采用逐步移除节点和重复计算的方式,考察网络最大连通子图和节点移除比例的关系,同时对数值仿真结果进行合理分析。研究结果说明基于网络全局信息的介数中心性和PageRank算法对节点重要度评估的效果更好,同时说明网络的可靠性与网络拓扑结构有关,实际复杂网络一般同时具备多种拓扑特性。  相似文献   

19.
Personalized PageRank, as a basic algorithm in large graph analysis, has a wide range of applications in search engines, social recommendation, community detection, and other fields and it has been a hot problem of interest to researchers. The existing distributed personalized PageRank algorithms assume that all data are located in the same geographic location and the network environment is the same among the computing nodes where the data are located. However, in the real world, these data may be distributed in multiple data centers across continents, and these geo-distributed data centers are connected to each other through WANs, which are characterized by heterogeneous network bandwidth, huge hardware differences, and high communication costs. Moreover, the distributed personalized PageRank algorithm requires multiple iterations and random walk on the global graph. Therefore, the existing distributed personalized PageRank algorithms are not applicable to the geo-distributed environment. To address this problem, the GPPR (Geo-distributed Personalized PageRank) algorithm is proposed in this paper. The algorithm first preprocesses the big graph data in the geo-distributed environment and maps the graph data by using a heuristic algorithm to reduce the impact of network bandwidth heterogeneity on the iteration speed of the algorithm. Secondly, GPPR improves the random walk approach and proposes a probability-based push algorithm to further lower the number of iterations required by the algorithm by reducing the bandwidth load of data transmission between working nodes. We implement the GPPR algorithm based on the Spark framework and build a real geo-distributed environment in AliCloud to conduct experiments comparing the GPPR algorithm with several existing representative distributed personalized PageRank algorithms on eight open-source big graph datasets. The results show that the communication data volume of GPPR is reduced by 30% on average in the geo-distributed environment compared with that of other algorithms. In terms of algorithm running efficiency, GPPR improves by an average 2.5 factor compared with other algorithms.  相似文献   

20.
个性化PageRank作为大图分析中的的基本算法,在搜索引擎、社交推荐、社区检测等领域具有广泛的应用,一直是研究者们关注的热点问题.现有的分布式个性化PageRank算法均假设所有数据位于同一地理位置,且数据所在的计算节点之间具有相同的网络环境.然而,在现实世界中,这些数据可能分布在跨洲际的多个数据中心中,这些跨域分布(Geo-Distributed)的数据中心之间通过广域网连接,存在网络带宽异构、硬件差异巨大、通信费用高昂等特点.而分布式个性化PageRank算法需要多轮迭代,并在全局图上进行随机游走.因此,现有的分布式个性化PageRank算法不适用于跨域环境.针对此问题,本研究提出了GPPR(Geo-Distributed Personalized PageRank)算法.该算法首先对跨域环境中的大图数据进行预处理,通过采用启发式算法映射图数据,以降低网络带宽异构对算法迭代速度的影响.其次,GPPR改进了随机游走方式,提出了基于概率的push算法,通过减少工作节点之间传输数据的带宽负载,进一步减少算法所需的迭代次数.我们基于Spark框架实现了GPPR算法,并在阿里云中构建真实的跨域环境,在8个开源大图数据上与现有的多个代表性分布式个性化PageRank算法进行了对比实验.结果显示,GPPR的通信数据量在跨域环境中较其他算法平均减少30%.在算法运行效率方面,GPPR较其他算法平均提升2.5倍.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号