首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
罗知林  陈挺  蔡皖东 《计算机科学》2014,41(4):62-64,74
转发(Retweet)是微博中一个重要的信息传播机制,用户可以将其关注者(Follower)的有趣微博转发到自身平台,分享给他的粉丝(Fan),快速地实现微博信息的传播。主要对微博转发预测进行了研究,首先提取了重要特征,比如用户间的微网络结构、权重比率、用户个人信息等,以研究用户微博转发行为,然后基于以上特征提出了一个随机森林微博转发预测算法(RFMR)。实验结果表明,RFMR算法优于其他分类算法,可以有效地用来预测微博转发。  相似文献   

2.
转发是微博提供的一个信息传播的机制,用户能够将关注者发布的有趣微博转发到自身平台,然后分享给追随者,是微博网络中信息传播最重要的功能。对于微博网络存在的不同类型连接关系,首先提取出相关特征,如同质性、微网络结构、地理距离以及用户性别等,用于识别连接关系的不同类型,然后采用Log-linear模型来拟合各个特征间系数,基于这些系数对微博用户转发行为形成的内在原因进行了分析。  相似文献   

3.
郑志蕴  郭芳  王振飞  李钝 《计算机科学》2016,43(12):41-45, 70
随着微博的迅速兴起和其影响力的不断提高,提取微博信息传播特征和构建传播模型已成为了研究热点。针对用户转发行为,首先分析了信息传播机制;然后从影响用户转发行为的发布用户、接收用户、用户亲密度和信息时效性4个方面提取出8个特征因素进行建模;在借鉴传染病动力学SIR模型的基础上,引入用户行为分析和接触节点,提出基于用户行为分析的SCIR模型,并给出动力学方程;最后利用新浪微博真实转发数据验证模型的合理性。实验结果表明,考虑用户转发行为的8个影响因素,结合行为分析结果,能够较好地拟合信息传播过程。  相似文献   

4.
文中以新浪微博为研究对象,以分析新浪微博的信息转发与传播特征为研究目的,并对传播行为进行预测.在获取大量新浪微博在线数据的基础上,对各种可能影响用户转发行为的因素进行统计、分析,挖掘各种影响因素特征并进行建模.提出基于用户属性、社交关系和微博内容三类综合特征,使用机器学习的分类方法,对给定微博的用户转发行为进行预测.基于微博网关注关系拓扑,利用概率级联模型对给定微博的转发路径进行预测,为预测微博的影响范围提供依据.文中通过实验分析了新浪微博符合复杂网络特征、社交类特征对转发行为有重要影响,并验证了传播预测的有效性.  相似文献   

5.
随着微博的爆炸式发展,微博已成为消息扩散和舆论传播的重要平台。研究微博信息的传播对市场营销、舆情管控等方面都具有重要意义。根据微博信息传播特点,结合传染病动力学原理,提出基于经典SIR(Susceptible-Infectious-Recovered)传染病模型的微博信息传播预测模型。该模型考虑了微博用户转发行为对信息传播机理的影响,构建具有微博传播特性的演化方程组。实验结果表明,该模型比SISe模型的预测误差更小,可以更准确地拟合和预测微博信息的转发数,从而预测得出微博信息的传播趋势。  相似文献   

6.
为了评价微博的传播效果, 在分析影响用户转发行为因素的基础上, 提出了采用用户影响力、用户活跃度、兴趣相似度、微博内容重要性和用户亲密程度五项特征进行转发行为预测的SVM算法, 以及基于该算法的转发规模预测算法。最后给出了传播规模预测的评价方法。针对新浪微博用户数据的实验表明, 预测精度达到了86. 63%。  相似文献   

7.
随着网络的飞速发展,微博逐渐成为社交网络中信息传播及信息收集的重要平台,微博转发是微博信息传播的重要途径,研究微博转发问题对微博信息传播、微博营销、舆情监控有着极其重要的意义.影响微博转发的主要因素有:粉丝兴趣与微博文本的相似度,微博营销策略及用户粉丝数量的变化.以往的预测模型没有综合考虑这两方面因素,基于此,提出了一种基于循环神经网络的方法来对微博转发量级进行预测,首先利用SIM-LSTM模型构建微博转发趋势度,然后再利用TF-IDF构建粉丝兴趣和微博文本的相似度,最后通过神经网络模型来预测粉丝是否会转发该微博.实验结果表明本文提出的算法相对于其他预测算法F1评估值提高了近5%.  相似文献   

8.
微博转发预测是研究信息传播的关键问题之一,对于舆情监控、广告投放、商业决策具有重要意义。用户兴趣、微博作者影响力及微博内容等信息均影响信息传播过程。转发行为预测的挑战性问题在于如何捕获更多有意义的影响因素以提高预测性能。提出基于混合特征学习的转发预测方法,该方法首先引入并分析了局部社会影响力特征、用户特征、微博内容特征的计算方法;接着,基于分类器建立预测模型;最后,比较了不同类型微博的转发预测效果。在新浪微博平台数据的实验结果表明,局部社会影响力特征、用户特征、微博内容特征都对转发预测有较大影响,其中微博内容特征的影响最大。随机森林预测效果最好,准确率达到83.1%;与朴素贝叶斯、逻辑回归、支持向量机模型相比,准确率平均提高约7.4%,最高提高约10.8%。另外,该方法对自然灾害、环境、审判、维权等类型的微博进行转发预测时,效果更加明显,说明这类事件转发的规律性更强。  相似文献   

9.
在全部微博内容中,由用户转发而产生的信息占有非常大的比例。同时,内容的转发也是微博中信息传播的主要途径。因此,用户的转发行为有着重要的研究价值,可应用于社交营销、微博检索、热点事件预测等领域中。该文中,我们通过分析所收集的大量真实的新浪微博数据,发现影响用户转发行为的一些因素: 微博作者、用户兴趣以及微博热度。基于这些发现,该文提出了一种新颖的基于LDA模型的方法,综合利用以上3个特征预测用户转发行为。为了对该方法进行评价,我们利用收集的大量的微博数据及对应的社交网络结构模拟真实用户环境。实验表明,该方法的性能优于目前最好的方法,F值比其他基线方法高出35%—45%。  相似文献   

10.
微博用户影响力分析作为社交网络分析的重要组成部分,一直受到研究人员的关注。针对现有研究工作分析用户行为时间性的不足和忽略用户与参与话题之间关联性等问题,提出了一种面向微博话题的用户影响力分析算法——基于话题和传播能力的用户排序(TSRank)算法。首先,基于微博话题分析用户转发行为时间性,进一步构建用户转发和用户博文转发两种话题转发关系网络,预测用户话题信息传播能力;然后,分析用户个人历史微博和背景话题微博文本内容,挖掘用户与背景话题之间的关联性;最后,综合考虑用户话题信息传播能力以及用户与背景话题间关联性计算微博用户影响力。爬取新浪微博真实话题数据进行实验,实验结果表明,话题关联度更高用户的话题转发量明显大于关联度很低的用户,引入用户转发行为时间性相比无转发时间性,TSRank算法的捕获率(CR)提高了18.7%,进一步与典型影响力分析算法WBRank、TwitterRank和PageRank相比,TSRank算法在准确率和召回率上分别提高了5.9%、8.7%、13.1%和6.7%、9.1%、14.2%,验证了TSRank算法的有效性。该研究成果对社交网络的社会属性、话题传播等理论研究以及好友推荐、舆情监控等应用研究具有支撑作用。  相似文献   

11.
微博客中转发行为的预测研究   总被引:1,自引:0,他引:1  
张旸  路荣  杨青 《中文信息学报》2012,26(4):109-115
在微博客中,转发对信息的传播有着至关重要的影响,各种各样的信息正是通过转发得以在微博客上广泛且迅速的传播。另外在很多领域中,例如,市场营销、政治选举和热点提取等,也都需要深入探讨转发的各种特性。该文中,我们以Twitter为例,通过预测一条tweet是否会被转发,研究微博客中的转发行为。为解决这个问题,我们使用机器学习中的分类算法,并通过对微博上不同特征的重要性进行分析,提出了基于特征加权的预测模型。实验表明,我们的特征加权模型很好的解决了微博客中的转发预测问题,大约86%的微博能被成功预测。  相似文献   

12.
微博网络测量研究   总被引:9,自引:0,他引:9  
随着移动通信和Web技术的不断突破,以微博为代表的在线社会网络在中国广泛发展起来,越来越多的人开始使用微博进行信息分发和舆论传播.为了了解中国微博网络中的拓扑结构特征和用户行为特征等内在信息,对国内最大的微博系统——新浪微博——开展了主动测量,并结合已有的在线社会网络测量结果,对新浪微博的网络拓扑和用户行为特征进行了分析和比较.主要发现包括:1)新浪微博网络具有小世界特性;2)新浪微博网络的入度分布属于幂次分布,而出度分布表现为某种分段幂率函数;3)与类似社会网络相比,新浪微博网络的出入度不具有相关性;4)新浪微博网络属于同配网络;5)新浪微博用户发博时间具有明显的日分布和周分布模式;6)新浪微博用户博文数目分布表现为威布尔分布;7)新浪微博用户博文的转发和评价行为具有很强的相关性,且博文转发概率要高于评价概率.这些测量研究和发现不仅有助于设计出符合中国微博网络结构特征的数学模型和计算模型,也是实现对微博舆论的监测、引导、控制等方面的重要依据和基础.  相似文献   

13.
Individual retweeting behavior plays a fundamental role in information propagation on social media. While researchers have demonstrated the benefits of individual retweeting behavior to online retailers, a largely uninvestigated issue is the mechanism of individual retweeting behavior. Drawing on the social communication theory, we develop an integrated conceptual framework to investigate this issue. An analysis of a panel dataset, which consists of 440 valid users from Twitter.com across six years, indicates that all the major components of a social communication process have significant impacts on individual retweeting decision: (1) information source (e.g., source trustworthiness), (2) information richness of the stimuli (3) information receiver's topical preference, (4) relationship between the source and the receiver (e.g., social tie strength), and (5) contextual factors (e.g., bandwagon effect). Among them, social tie strength and topical relevance with the receiver are the most important factors, followed by information richness of the stimuli and bandwagon effect. However, information source-related factors have trivial impacts on individual retweeting decision. We reevaluate the ranking using multiple feature selection methods and confirm the ranking result. Prediction performance is carried out between the salient features and the full feature set. Finally, we discuss important implications for practice and future research directions.  相似文献   

14.
赵煜  邵必林  边根庆  宋丹 《计算机应用》2015,35(7):1959-1964
针对微博转发预测方法研究中的数据集不平衡问题,提出了一种融合过采样技术和随机森林(RF)算法的微博转发行为预测方法。首先,定义了个体信息、社交关系和微博主题3类与微博转发行为相关的特征,并基于信息增益算法实现了关键特征选取;其次,综合微博特征数据的特点来改进少数类样本合成过采样技术(SMOTE),对原始数据集进行非参数概率分布估计,并根据近似概率分布对数据集进行过采样处理,从而使正反例数据量达到平衡;最后,利用随机森林算法,依据微博转发关键特征进行分类器训练,并利用袋外(OOB)数据误差估计来分析和设置随机森林算法的相关参数。通过与基于决策树(DT)、支持向量机(SVM)、朴素贝叶斯(NB)和随机森林等算法的微博转发预测方法进行对比,所提方法整体性能优于基准方法中性能最优的SVM方法,召回率提高了8%,F值提高了5%。实验结果表明,所提方法在实际应用中能够有效提高微博转发行为预测的准确率。  相似文献   

15.
基于行为预测的微博网络信息传播建模   总被引:1,自引:0,他引:1  
研究微博网络中的信息传播及扩散机制在市场营销、舆情管控等方面具有重要意义。当前的传播模型大多忽视了用户间的个体差异。为解决这一问题, 提取了影响转发行为的四类特征, 利用机器学习中的逻辑回归模型分析预测个体转发行为, 并在此基础上融入用户个体差异, 建立了一种基于行为预测的信息传播模型。实验表明, 该模型能较好地模拟真实网络中的信息传播过程。  相似文献   

16.
微博数据具有实时动态特性,人们通过分析微博数据可以检测现实生活中的事件。同时,微博数据的海量、短文本和丰富的社交关系等特性也为事件检测带来了新的挑战。综合考虑了微博数据的文本特征(转帖、评论、内嵌链接、用户标签hashtag、命名实体等)、语义特征、时序特性和社交关系特性,提出了一种有效的基于微博数据的事件检测算法(event detection in microblogs,EDM)。还提出了一种通过提取事件关键要素,即关键词、命名实体、发帖时间和用户情感倾向性,构成事件摘要的方法。与基于LDA(latent Dirichlet allocation)模型的事件检测算法进行实验对比,结果表明,EDM算法能够取得更好的事件检测效果,并且能够提供更直观可读的事件摘要。  相似文献   

17.
微博网络信息传播研究综述   总被引:2,自引:0,他引:2  
微博作为一种新型的社交网络平台, 以其使用方式便捷、传播迅速、交互性强等特点, 在信息分发和舆论传播方面发挥了非常重要的作用。简要介绍了微博的相关机制, 分析了微博信息的传播特征以及影响信息传播的三大因素, 对目前研究所使用的信息传播模型进行了分类, 重点综述了基于传播过程的模型、基于影响力的模型以及基于转发因素的模型, 并对这三类模型的优缺点作了比较分析, 提出了该领域的研究方向和目标。  相似文献   

18.
Identifying dominating features that affect individual information retweeting behavior on social networking sites (SNSs) is crucial to understanding individual retweeting behaivor and developing effective marketing strategies on SNS. However, there is little agreement on what factors are dominating individual information disseminating behavior on SNS, and what’s worse, more and more factors are added into the prediction model, without examining the relevance of them and even why these factors are added is rarely discussed. This leads to undesirable outcomes such as increasing the cost of measuring and computing irrelevant/redundant features. Most importantly, it hinders us from understanding what discriminative features are affecting individual information disseminating behavior. Using a unique real-life Twitter data set consisting of 55,575 twitterers and 9,440,321 tweets, the authors examine what discriminative features are dominating individual information disseminating behavior. The results indicate that topic distance is the most discriminative factor, highlighting that self-presentation motives play an important role in information disseminating decisions. Besides, the amount of information, social relationship and the popularity of the tweet also contribute to individual information disseminating decisions. Experiments demonstrate that adopting only dominating factors can improve prediction performance in terms of various indicators, compared with adopting the full features set. Finally, we conclude the paper by discussing theoretical and practical implications of our findings.  相似文献   

19.
话题摘要是自然语言处理中对文本进行内容归纳和概要生成的技术.传统的话题摘要研究主要针对新闻、Web网页和博客这样的长文本,本文研究微博短文本的话题摘要问题.本文以微博转发消息为对象,提出具有拓扑结构的微博话题摘要生成算法(Microblog topic summarization,MTS).首先通过微博转发上下文确定代表性词项;然后识别微博转发中的话题区域,从广度和深度两个方向对话题进行归并操作;最后,基于转发关系生成具有拓扑结构的微博话题摘要.本文实验采用真实的微博事件数据集验证MTS算法的有效性和可行性,并采用可视化方式展现微博话题摘要的结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号