首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
舆情分析关乎国家发展与社会和谐,目前已有越来越多的机构和行业从事舆情分析。面对互联网海量的数据信息,新浪微博舆情热点分析系统以目前使用极为普遍的新浪微博为数据源,着眼于新浪微博热点信息的分析。新浪微博舆情热点分析系统目前已经实现了微博抓取、微博分析。文章介绍了系统的体系结构和详细设计,并对系统在实现中所遇到的主要问题及解决方案进行了描述。最后,文章分析了系统需要改进的方面,以及该领域的研究和发展方向。  相似文献   

2.
网络舆情事件中,微博炒作账号对炒作行为事件的传播和发展带来了巨大的不可控因素,隐匿背后的炒作群体是互联网中不可忽视的特殊群体。文章提出基于社团发现算法的微博炒作账号发现方法,通过构建博主关联网络,挖掘网络特征,对网络中的微博炒作账号进行自动发现。文章以“湖南临武瓜农死亡”事件为实验对象,基于新浪微博数据构建了该事件的博主关联网络,对该事件中的微博炒作账号进行发现和甄别,验证了本文方法的有效性。  相似文献   

3.
殷美桂 《现代计算机》2023,(20):104-108
大数据背景下,构建网络舆情系统能有效、及时地对舆情进行监督和引导。利用Python Django+Vue前后端分离技术方案搭建基于B/S的网络舆情系统。服务器端采用Scrapy框架爬取新浪微博的学校舆情数据,数据预处理后进行情感倾向分析;客户端展示网络舆情分析的结果。系统具有扩展性强、操作简单等特点,解决了学校网络舆情监管问题。  相似文献   

4.
随着Web 2.0时代的到来,舆情信息在微博上能够更快速的产生和传播。为了有效地分析微博舆情信息,微博数据的获取显得尤为重要。文中以新浪微博为研究对象,提出了基于模拟登录的网络爬虫采集方案。此方案解决了调用微博API接口对开发者的次数限制,解决了传统的网络爬虫需要身份验证的问题,加快了微博数据的采集速度,可以在短时间内获得海量的微博数据。实验表明,用该方案开发的系统具有快速的微博信息采集速度,更加灵活,可以很好地为舆情系统分析提供大量准确的数据支持。  相似文献   

5.
随着网络的广泛使用,网络媒体已被认为是继报纸、广播、电视三大新闻媒介之后的"第四媒体",它有许多传统媒体无法比拟的优点,如它有表达快捷、信息多元、方式互动等特点。网络已经成为了折射社会舆论导向的主要载体之一,它在舆论信息的传播中扮演着十分重要的角色。在网络环境下,舆情的主要来源有:QQ空间、新浪微博、论坛、博客等。这几种典型媒介都有着各自的特点,据统计QQ空间是所有网络信息中,网民关注度最高,信息量最大的;以新浪微博为代表的微博类社交媒体是继Email、BBS、ICQ、Blog之后出现的第五种网络交流形式,是网络化信息化时代的"信息宝藏",里面的信息量是巨大的。为了能够及时发现网络舆情,本文我提出了一种设计网络舆情系统的架构,并对其进行了深入分析。  相似文献   

6.
校园舆情监测主要正对的是微博数据,而微博数据处理属于大数据范畴,其前提是获取大量的微博数据,文章尝试应用网络多媒体内容采集、数据分析等技术,完成针对校园网络舆情信息的有效提取与分析研究。分析了网络爬虫技术发现系统应解决的基本问题及涉及的元数据管理等关键技术,提出了相关的解决方案,同时设计出可稳定获得新浪微博数据的挖掘方案,并给出情感分析应用实例,将挖掘方案获取微博上的数据,应用于微博情感分析中。  相似文献   

7.
首先通过研究网络爬虫以及新浪微博的开放平台,设计实现新浪微博专用爬虫,获取研究数据。其次,通过实验得到重要用户节点指标,提出贝叶斯-PageRank算法筛选重要用户节点,并实验验证重要用户节点的有效性。最后通过对重要用户节点的监测实现网络舆情发现并给出相关舆情引导策略。  相似文献   

8.
传统的敏感舆情模型中,不论是基于文本或是数据挖掘的分析方法都是直接处理网络舆情,未结合网络传播特性分析.针对上述问题,研究并采用基于微博交互关系算法:通过量化微博的敏感程度,分析用户的交互关系来构建微博敏感舆论传播模型.实验基于新浪微博,搜索到一定数量的敏感用户,对用户的交互行为进行分析,得到未来有发表敏感舆论倾向的用户并进行监控.实验结果证明,与传统的舆情模型相比,该方法可行且有效,开拓了舆情分析思路,适用于当前网络舆情研究.  相似文献   

9.
微博是舆情话题传播的重要渠道,研究微博网络中的舆情话题传播机制,将有利于对舆情话题的传播过程进行分析与监控,而传统的网络信息传播模型却无法真实地描述微博网络中的舆情话题传播机制。针对以上问题,分析了微博网络中的信息互动模式及舆情话题的传播特点,以传染病动力学中的SIR模型为基础,通过引入一个新的节点状态--接触状态,构建了基于SCIR(Susceptible Contacted Infected Removed)的微博网络舆情话题传播模型。仿真结果表明,该模型可以很好地描述微博网络中的舆情话题传播规律。  相似文献   

10.
微博在信息共享与传播方面的独特优势,使得针对微博的研究越来越多。现阶段,针对校园舆情监测的信息较少,我们基于新浪微博设计开发了一款面向校园的微博舆情监测系统,实现了爬取信息、监测敏感词和分析用户影响力排名的功能。这里通过新浪微博api快速的爬取已经发布的微博,将爬取的数据使用IK正向迭代最细粒度切分算法进行分词与敏感词的提取,最后使用pagerank算法对用户的影响力进行排名。在大数据的背景下,该系统有着广阔应用范围和前景。  相似文献   

11.
Microblogging websites such as twitter and Sina Weibo have attracted many users to share their experiences and express their opinions on a variety of topics, making them ideal platforms on which to conduct electronic opinion polls on products, services and public figures. However, conventional sentiment analysis methods for microblogging messages may not meet the demands of opinion polls for public figures. Therefore, in this study, we focus mainly on the problem of sentiment analysis for opinion polling on Chinese public figures. We propose a sentiment parsing-based architecture, which represents and labels opinion targets and their corresponding sentiments jointly to avoid the mismatching of them, for opinion poll of public figures using microblogs. Furthermore, we formulate sentiment parsing of microblogging sentences as a sequence labeling problem and adapt different Recurrent Neural Network (RNN) models to train and infer the model. Our experimental results demonstrate that the proposed sentiment parsing-based methods achieve better performance than conventional sentiment score-based methods in opinion polling on public figures using microblogs.  相似文献   

12.
微博网络测量研究   总被引:9,自引:0,他引:9  
随着移动通信和Web技术的不断突破,以微博为代表的在线社会网络在中国广泛发展起来,越来越多的人开始使用微博进行信息分发和舆论传播.为了了解中国微博网络中的拓扑结构特征和用户行为特征等内在信息,对国内最大的微博系统——新浪微博——开展了主动测量,并结合已有的在线社会网络测量结果,对新浪微博的网络拓扑和用户行为特征进行了分析和比较.主要发现包括:1)新浪微博网络具有小世界特性;2)新浪微博网络的入度分布属于幂次分布,而出度分布表现为某种分段幂率函数;3)与类似社会网络相比,新浪微博网络的出入度不具有相关性;4)新浪微博网络属于同配网络;5)新浪微博用户发博时间具有明显的日分布和周分布模式;6)新浪微博用户博文数目分布表现为威布尔分布;7)新浪微博用户博文的转发和评价行为具有很强的相关性,且博文转发概率要高于评价概率.这些测量研究和发现不仅有助于设计出符合中国微博网络结构特征的数学模型和计算模型,也是实现对微博舆论的监测、引导、控制等方面的重要依据和基础.  相似文献   

13.
社交网络平台信息传播迅速,为了有效地进行舆情预警,定量地评估用户在消息传播网络中重要性,将模糊综合评价方法引入用户影响力建模问题中. 通过对用户在社交平台上的行为分析,构造了包含用户活跃粉丝数以及平均转发数等五项指标在内的评价体系. 并针对传统的模糊综合评价算法在应用于计算评价指标权重方面的缺陷与不足,提出改进模糊合成算子的方法构建用户影响力评估模型. 利用新浪微博社交平台上的真实数据,结合对比实验和实际评估,改进的模糊合成算子能根据需求调整权重对评价结果的影响,同时该方法能较准确地反应社交网络中用户的实际影响力.  相似文献   

14.
基于Hadoop的微博舆情监控系统   总被引:1,自引:1,他引:0  
随着在线社会网络如社交网站、微博、在线社区等的快速发展, 一个真正的双向传播和新媒体时代逐步形成. 在线社会网络让每个用户都能创造自己的内容, 并且快速传播出去. 据不完全统计, 新浪微博平均每秒有超过1000条的新微博产生, 日增量数据为5TB, 因此海量数据给舆情监控带来了严峻的挑战. 将介绍一种基于Hadoop的微博舆情监控系统, 能够对大规模采集数据进行挖掘、分析, 实现对舆情热点话题的发现及追踪、对微博的社会网络分析, 分析结果可视化呈现, 为党政机关、大型企业等单位和组织及时发现敏感信息、掌握  相似文献   

15.
吴信东  李亚东  胡东辉 《软件学报》2014,25(12):2877-2892
社交网络是人类借用计算技术和信息技术进行信息交流、建立人际交互关系等社会活动的一种新型工具,已成为社会计算中研究社会软件的核心课题之一。社交网页取证旨在对用户信息进行证据获取、固定、分析和展示,提供直接、有效、客观、公正的第三方依据。在互联网飞速发展的背景下,社交网页取证面临着用户信息多样、内容动态(实时)变化、海量、交互和图片内容是否可信的挑战,已成为社交网络和社会计算中舆情分析、情感计算、社交网络关系的内容分析以及个人、群体和社会性行为分析的一个重要难题。针对社交网页取证问题,以新浪微博为例,设计了一套取证解决方案,对用户发表的信息、人脸图片、位置信息进行固定,依靠网页取证方法来认证信息的可信性。同时,利用信息可视化展示手段和辅助分析来应对在海量社交网页数据背景下的计算机取证工作。  相似文献   

16.
当前,由于全民自媒体兴起而引发了巨大的舆情危机,如何高效快速地从海量的碎片化信息中发现热点并抽取实用信息成为一项重大的挑战。在此背景下,提出一种基于Lex-PageRank的微博摘要优化方法,在该方案中,以聚类结果作为实验数据,从微博影响力周期的时间特性和权重属性考虑,提出改进的Lex-PageRank算法,从聚类结果中抽取若干文本组织生成摘要。在新浪微博数据基础上进行的对比实验表明,本方案可以有效地从大量文本中提取出关键信息。  相似文献   

17.
该文主要介绍基于安卓系统旅游日记的设计过程,该系统以Android系统为开发平台,使用Java语言作为编程工具,申请百度地图的标识key开发地图,使用新浪微博认证接口开发微博。以九宫格方式作为页面布局,系统整体结构非常清晰并具有良好的扩展性。  相似文献   

18.
随着互联网的发展,有效地对网络舆情进行监管和引导对社会的和谐稳定具有重要意义,网络事件的热度预测是舆情监管的重要组成部分。针对传统方法在预测的过程中忽视了事件时间序列中蕴含的时态信息和关联性,提出了一种基于EKSC算法的网络热点事件热度预测模型。该模型使用EKSC算法对每类已知网络舆情事件的时间序列进行聚类,并构建类模型库。对待预测事件已知的热度时间序列进行缩放变化,并使用最小二乘法选取类模型库中均方误差和最小的模型对该事件进行预测。实验表明,该方法能够对网络热点事件的热度进行有效的预测。  相似文献   

19.
信息传播的高速性加剧了谣言等网络污染在微博网络中的扩散。微博网络的用户量和信息量极为庞大。因此,对微博污染传播机制和污染检测手段的研究显得尤为重要。根据基于用户影响力建立的微博谣言传播模型,利用蚁群算法逆推污染传播路径,搜索受染用户,并分别以Twitter和新浪微博为实验平台,通过对比分析验证了模型的可行性。实验结果表明:模型通过对受染个体的搜索,缩小了污染的检测范围,提高了微博污染的治理效率和准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号