首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
文中以新浪微博为研究对象,以分析新浪微博的信息转发与传播特征为研究目的,并对传播行为进行预测.在获取大量新浪微博在线数据的基础上,对各种可能影响用户转发行为的因素进行统计、分析,挖掘各种影响因素特征并进行建模.提出基于用户属性、社交关系和微博内容三类综合特征,使用机器学习的分类方法,对给定微博的用户转发行为进行预测.基于微博网关注关系拓扑,利用概率级联模型对给定微博的转发路径进行预测,为预测微博的影响范围提供依据.文中通过实验分析了新浪微博符合复杂网络特征、社交类特征对转发行为有重要影响,并验证了传播预测的有效性.  相似文献   

2.
分析和监测微博文本中所包含的情感信息,能够挖掘用户行为,为微博舆情监管提供借鉴。但微博文本具有长度较短、不规范、存在大量变形词和新词等特点,仅以情感词为特征对微博进行分类的方法准确率较低,难以满足实际使用。为此,基于微博语料构建二元搭配词库,并根据PMI-IR算法结合语料库统计信息,提出搭配词组情感权值的计算方法PMI-IR-P。结合情感词典,采用统计方法生成微博情感特征向量,利用机器学习中的C4.5算法构建分类模型,对微博文本进行情感倾向分类。分别使用不同的数据集用于构建搭配词库及分类模型,并与基于情感词典的分类方法以及朴素贝叶斯分类方法进行对比。实验结果表明,提出的情感特征通过运用C4.5算法对微博文本情感分类的准确率达到87%,具有较好的效果。  相似文献   

3.
为更有效地甄别微博僵尸粉,提出一种基于微博注册用户名特征提取的智能分类方法.以新浪微博作为研究平台,通过对微博用户数据进行分析,构建标准匹配库,提取用户名特征向量,再分别利用支持向量机(SVM)和人工神经网络(ANN)方法对特征集合进行分类.实验结果表明,将用户名特征提取与SVM、ANN相结合,僵尸粉甄别准确率均高于92%.  相似文献   

4.
针对微博活跃用户数估计问题,给出一种基于活跃周期的活跃用户定义,并在此基础上改进捕获再捕获模型,基于新浪微博时间线数据对新浪微博活跃用户数进行了估计。实验验证本方法能够较为准确地估计具有不同活跃周期的用户的规模。  相似文献   

5.
杨超  秦廷栋  范波  李涛 《计算机科学》2018,45(11):138-142, 159
将人工免疫危险理论引入到用户行为特征的分析中,以有效地识别微博水军用户。以新浪微博为例,分析了新浪微博水军的行为特征,选取微博总数、微博等级、是否认证、阳光信用、粉丝数等特征属性,将属性分析结果作为区别水军与正常用户的特征信号,并基于树突状细胞算法(Dendritic Cells Algorithm,DCA)实现新浪微博水军的识别。使用新浪微博用户的真实数据对算法的有效性进行了验证和对比实验,结果表明该方法能够有效检测出新浪微博中的水军用户,具有较高的检测准确率。  相似文献   

6.
随着互联网技术的发展, 个性化标签推荐系统在海量信息或资源过滤中起着重要的角色. 在新浪微博平台中, 用户可以自主的给自己添加标签来表明自己的兴趣爱好. 同时, 用户也可以通过标签来搜索与自己兴趣爱好相似的用户. 针对新浪微博中大部分用户没有添加标签或添加标签数目较少的问题, 提出了一种基于RBLDA模型和交互关系的微博标签推荐算法, 它首先利用RBLDA模型来产生用户的初始标签列表, 然后再结合用户的交互关系而形成的交互图来预测用户标签的算法. 通过在新浪微博真实数据集上的实验发现, 该方案与传统的标签推荐算法相比, 取得了良好的实验效果.  相似文献   

7.
针对微博虚假用户问题,以新浪微博为研究平台,对微博用户的行为进行分析,从在线时长、发帖时间、互动程度等方面,提取用于区分用户类别的特征变量,运用逻辑回归算法,提出一个基于逻辑回归的微博用户可信度评价模型。实验结果表明,该模型能够对传统的虚假用户“僵尸粉”进行识别,对新型虚假用户有较高的识别率,可以根据置信值的大小对用户进行大致分类,实用性较强。  相似文献   

8.
微博在信息共享与传播方面的独特优势,使得针对微博的研究越来越多。现阶段,针对校园舆情监测的信息较少,我们基于新浪微博设计开发了一款面向校园的微博舆情监测系统,实现了爬取信息、监测敏感词和分析用户影响力排名的功能。这里通过新浪微博api快速的爬取已经发布的微博,将爬取的数据使用IK正向迭代最细粒度切分算法进行分词与敏感词的提取,最后使用pagerank算法对用户的影响力进行排名。在大数据的背景下,该系统有着广阔应用范围和前景。  相似文献   

9.
为了评价微博的传播效果, 在分析影响用户转发行为因素的基础上, 提出了采用用户影响力、用户活跃度、兴趣相似度、微博内容重要性和用户亲密程度五项特征进行转发行为预测的SVM算法, 以及基于该算法的转发规模预测算法。最后给出了传播规模预测的评价方法。针对新浪微博用户数据的实验表明, 预测精度达到了86. 63%。  相似文献   

10.
微博网络测量研究   总被引:9,自引:0,他引:9  
随着移动通信和Web技术的不断突破,以微博为代表的在线社会网络在中国广泛发展起来,越来越多的人开始使用微博进行信息分发和舆论传播.为了了解中国微博网络中的拓扑结构特征和用户行为特征等内在信息,对国内最大的微博系统——新浪微博——开展了主动测量,并结合已有的在线社会网络测量结果,对新浪微博的网络拓扑和用户行为特征进行了分析和比较.主要发现包括:1)新浪微博网络具有小世界特性;2)新浪微博网络的入度分布属于幂次分布,而出度分布表现为某种分段幂率函数;3)与类似社会网络相比,新浪微博网络的出入度不具有相关性;4)新浪微博网络属于同配网络;5)新浪微博用户发博时间具有明显的日分布和周分布模式;6)新浪微博用户博文数目分布表现为威布尔分布;7)新浪微博用户博文的转发和评价行为具有很强的相关性,且博文转发概率要高于评价概率.这些测量研究和发现不仅有助于设计出符合中国微博网络结构特征的数学模型和计算模型,也是实现对微博舆论的监测、引导、控制等方面的重要依据和基础.  相似文献   

11.
微博网站作为一种流行的社交媒体形式,在为用户提供丰富信息和服务的同时,也带来了信息超载问题。如何利用微博网络为用户推荐有价值的信息,以缓解信息超载问题,变得日益重要。根据微博网络的有向性以及建立关注关系的随意性等特点,提出了一种基于非负多矩阵分解的微博网络推荐方法,综合考虑了用户之间的关注关系、用户与微博内容的转发关系,以及微博内容与主题的所属关系等多源信息。基于新浪微博数据集进行了微博内容推荐实验,结果表明基于非负多矩阵分解的方法,能够有效利用微博网络中的多维信息,显著提高推荐准确度。本方法不仅能挖掘出微博内容的主题,还能挖掘出用户间的关联关系,还可推广到对用户进行好友和主题的推荐。  相似文献   

12.
康泽东  余旌胡  丁义明 《计算机应用》2014,34(12):3405-3408
Twitter和Sina微博注册用户构成关注关系社交网络,运用一种对称程度来研究其对称性随社交圈子规模变化的规律。首先根据收集的100万条新浪用户之间的关注关系和236个Twitter用户及其之间的关注关系来构建初始社交网络,选取其中具有明显对称性的连通子网络作为研究的主要对象,通过去除法得到:影响社交网络最大连通子网络对称性的主要因素是大V用户和可忽略用户。其次,采用比较分析法得出Twitter的大V用户构成的社交子网络对称性较强。最后,从功能定位方面分析了两种微博的不同;通过对初始网络的所有连通子网络的对称程度的研究,得出社交圈规模越小、相应的对称性越强的结论。  相似文献   

13.
舆论在微博上的传播过程可以抽象成一个生长的复杂网络。在分析微博网络特性和用户行为习惯的基础上,考虑新用户在进入网络时的同配性,建立微博关系网络的演化模型,并对模型进行仿真。分析指出,微博网络呈现出指数与幂律的混合分布。对微博网络进行实证研究,结果表明,微博关系网络中节点的度分布服从指数截断的幂律分布,具有无标度和小世界特性,与理论分析的结果相一致。  相似文献   

14.
为了解决传统的文本主题模型对微博主题挖掘准确率低及不考虑主题之间关联的问题,针对中文微博语料本身的特点,分析LDA和HMM模型优缺点,提出了微博主题挖掘模型MB-HL(Microblog-Hidden Markov Model Latent Dirichlet Allocation)。该模型用逐条微博作为处理单元,建立分布主题-词语矩阵并进行优化,通过LDA模型对微博用户不同的行为建模并提取特征,利用HMM模型强大的时序状态建模能力弥补LDA在主题相关性上的不足,采用Gibbs采样进行推理求解。在真实的新浪微博数据上对比实验表明MB-HL模型能提高近9%主题关键词的准确度,并能有效地发现主题之间的关联关系。  相似文献   

15.
微博特有的移动终端轻博客发布与交互模式,使其迅速成为使用范围最大、影响力最大的社交媒体。新浪中文微博现有超过3亿用户,发展最为迅速,中文微博和其他微博相比具有独特性,一些大“V”博主的影响力堪比电台电视。通过分析微博的网络结构特征,总结出微博相对于其他传统社会载体的特性。利用PageRank算法的思想,设计了基于用户质量的User Impack Rank(UIR)排序算法。UIR算法通过用户相对微力值和用户相对链接质量对各博主的影响力进行动态的评估。在一个活跃的微博社区数据集上进行了全面的实验,实验结果显示了UIR算法能更加准确和客观地对用户的影响力进行排序,并且能有效地消除僵尸粉丝对排序的影响。  相似文献   

16.
语义检索是解决信息检索中准确度、人性化要求的一个非常有潜力的方法。通过对知识文档进行主题词标注,然后建立从词元→主题词→知识文档的二级索引结构;对用户的检索,进行查询词到主题词的转化,计算语义相似度,按照语义相似度算法进行排序文档。目前基于知识文档的语义检索系统已经在某集团公司进行部署和应用,取得了前5项结果命中用户总查询90%的效果,说明这种方法是语义检索的一种有效途径。  相似文献   

17.
社会化标签系统允许用户使用个性化的词汇对网络中的资源进行标注而被用户广泛接受。在微博网络中,用户可以为自己加注标签以推广自己或者方便别人找到自己。深入分析了微博用户数据,总结了微博用户标签的特点,针对LDA(latent Dirichlet allocation)主题模型在处理短文本时存在的不足,提出了一种基于好友关系约束主题模型。在此基础上对微博用户标签进行主题分析,计算用户的主题分布,对标签词进行聚类,并最终为用户推荐标签。通过对比实验证明了该方法可以提高标签推荐的准确度。  相似文献   

18.
针对现有微博主客观分类方法特征冗余度高和未考虑特征选择方法之间的互补关系问题,该文提出了一种基于融合特征的微博主客观分类方法。通过对多种不同特征选择方法进行有效组合,利用特征融合算法对词特征、内容特征、微博特征等基本特征进行了选择和融合,以获取更加有效的主客观分类特征。在新浪微博数据上的实验结果表明,该特征融合算法能够获得比最优单一特征选择方法更好的分类效果。  相似文献   

19.
庞磊  李寿山  张慧  周国栋 《计算机科学》2012,39(105):249-252
近年来,微博越来越受到网络用户的青睐,成千上万的用户通过发布微博共享他们的观点和情感。其中,有大量带有情感倾向(认为某事物“好”或“坏”)的微博,这些微博反映了作者的情绪。投资者情绪(investor sentiment)是研究经济市场走向的重要指标,行为金融学认为股票投资者情绪影响投资者决策,进而影响股票市场,而反映股票投资者情绪的重要指标是投资者对股票市场未来行情的情感倾向(认为股票市场未来行情“好”或“坏”)。通过对新浪微博(目前最大的中文微博平台)上股票投资者发布的文本进行情感信息方面的分析与研究,提出了一种自动识别股票投资者未来情感倾向的方法。该方法分为两级识别,第一级是:识别出微博中包含未来情感的句子;第二级是:将第一级识别出来的包含未来情感的句子分为正面评论(看涨)和负面评论(看跌)。实验结果表明,所提方法对自动识别股票投资者的未来情感倾向达到了非常好的效果。  相似文献   

20.
SQL Server2000数据库安全管理及配置   总被引:1,自引:0,他引:1  
从SQLServer2000的安装、用户权限管理、网络通信与系统环境等多个方面,讨论SQLServer2000的数据安全性和使用上的有关问题.使用户容易理解其管理机制,从而能快速进行数据库的安全配置。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号