首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
在社交网络时代,自媒体已成为群众发布、获取信息的重要渠道,网络舆情研判已经成为各级政府部门的主要任务之一。自媒体在反映个人情感和意见思潮的同时,也会汇聚群众的情感共鸣,因此对舆情文本的情感进行分析并获取其主题成为关键。通过爬虫工具对相关舆情文本进行抓取,将获取的数据使用Python的SnowNLP模块进行情感倾向划分,结合无监督的机器学习算法LDA主题模型进行文本关键词聚类,从而确定舆情规模、情感演变规律和舆情的热点主题词,为完善舆情应对机制提供科学支持。  相似文献   

2.
基于情感词典扩展技术的网络舆情倾向性分析   总被引:7,自引:0,他引:7  
随着Web2.0时代的到来,网络已逐渐成为反映社会舆情的重要载体之一,网络舆情发现及网民的观点和倾向性挖掘也成为新的研究热点,但是目前尚无有效反应网民对热点事件或话题总体态度的舆情分析系统.本文针对网民关于话题评论简单、数目众多的特点,应用HowNet和NTUSD两种资源对现有情感词典进行扩展,建立了一个新的、具有倾向程度的情感词典.基于扩展的情感词典,开发了一个半自动化网络舆情分析系统.该系统能够为用户提供更加细致、准确的评论倾向性分析结果.  相似文献   

3.
《微型机与应用》2018,(1):48-51
随着信息技术的发展,网络已经成为民众表达观点和意愿的主流媒介。网络舆情具有数量大、传播速度快和范围广的特点,面对海量的舆情信息,单靠人工分析和识别的方法远不能满足需求。因此,提出运用词嵌入的方式对文本特征进行抽取,再用机器学习的方法自动对舆情信息的倾向性进行分析。实验比较了几种不同机器学习方法的效果,结果表明,机器学习算法能快速且准确地对舆情倾向性做出判断,其中,集成学习方法在数据集上取得最高准确率。  相似文献   

4.
主要针对文本情感倾向性分析近年来的研究进行总结。首先介绍主客观文本分析的内容,接着从词语级、短语级、句子级、篇章级,介绍了文本情感倾向分析近些年的一些技术和研究,对其各自的优缺点进行概括。最后对文本情感倾向性分析进行总结,提出对未来研究的想法。  相似文献   

5.
主要针对文本情感倾向性分析近年来的研究进行总结。首先介绍主客观文本分析的内容,接着从词语级、短语级、句子级、篇章级,介绍了文本情感倾向分析近些年的一些技术和研究,对其各自的优缺点进行概括。最后对文本情感倾向性分析进行总结,提出对未来研究的想法。  相似文献   

6.
提出一种基于主题情感句的汉语评论文倾向性分析方法.根据评论文的特点,采用一种基于n元词语匹配的方法识别主题,通过对比与主题的语义相似度和进行主客观分类抽取出候选主题情感句,计算其中相似度最高的若干个句子的情感倾向,将其平均值作为评论文的整体倾向.基于主题情感句的评论文倾向性分析方法避免了进行篇章结构分析,排除了与主题无...  相似文献   

7.
白健  洪小娟 《软件工程》2022,(11):44-48
针对传统评论方式依赖整体感知且相对滞后的问题,以弹幕这一新兴短信息表达方式为研究对象,采用文本挖掘与情感分析的方式研究弹幕与网络舆情之间的潜在联系。采用网络爬虫技术采集网络舆情弹幕数据,使用Jieba库实现分词、去停用词及高频词统计,基于WordCloud库绘制词云图,实现可视化,并使用SnowNLP库计算网络舆情弹幕的情感得分,运用隐含狄利克雷分布(Latent Dirichlet Allocation, LDA)模型进行主题词提取,实现对网络舆情弹幕的情感分类和主题分析。实验结果表明,该方法可多维展现网民的情感倾向与关注焦点,是对传统评论文本研究的有效补充。  相似文献   

8.
文本倾向性分析已成为当前自然语言处理领域的研究热点,其研究成果具有极高的应用价值。针对网络在线中文评论的特点,基于领域本体与情感词典对商品评论倾向性进行分析。其主要思想是首先构建面向商品论坛的领域本体;其次利用情感词典与上下文极性算法计算情感词极性;再次通过将本体与SBV算法相结合,实现评价对象和评价词的二元组抽取;最后完成句子的倾向性分析。实验结果表明,有效提高了句子级倾向性分析的准确率。  相似文献   

9.
自媒体时代与网络社交软件的广泛普及,导致短视频平台极易成为舆情事件起源和发酵的“孵化器”。分析短视频平台中的舆情评论信息,对于舆情事件的预警、处置和引导具有重要意义。鉴于此,结合BERT与TextCNN模型,提出一种融合BERT多层次特征的文本分类模型(BERT-MLFF-TextCNN),并对抖音短视频平台中的相关评论文本数据进行情感分析。首先,利用BERT预训练模型对输入文本进行编码。其次,提取各编码层中的语义特征向量进行融合。然后,融入自注意力机制突出其关键特征,从而实现特征的有效利用。最后,将所得特征序列输入TextCNN模型中进行分类。实验结果表明,与BERT-TextCNN、GloVeTextCNN和Word2vec-TextCNN模型相比,BERT-MLFF-TextCNN模型表现更优,F1值达到了0.977。通过该模型能够有效识别短视频平台舆情的情感倾向,在此基础上利用TextRank算法进行主题挖掘,实现舆情评论情感极性的主题词可视化,为相关部门的舆情管控工作提供决策参考。  相似文献   

10.
基于情感词汇本体的主观性句子倾向性计算   总被引:1,自引:0,他引:1  
王晓东  王娟  张征 《计算机应用》2012,32(6):1678-1681
如何有效提取句子的主观信息,计算主观性句子倾向性,并对其情感进行细粒度分析,成为一个热门的研究话题。提出了一种基于情感本体的主观性句子倾向性分析方法,分析句子的上下文语义关系,建立规则集。依据情感词汇本体和规则集,提出连续三词词类组合(3-POS)模型识别主观性句子,最后计算主观性句子倾向性值。实验结果表明,该模型对主观性句子的倾向性进行识别和计算的准确率达到81.02%。  相似文献   

11.
随着移动互联技术的不断发展,社交媒体成为了公众分享观点和抒发情感的主要平台,在重大社会事件下对社交媒体文本进行情感分析能够有效监控舆情.针对现有中文社交媒体情感分析算法的准确性能和运行效率较低的问题,提出了一种基于Spark分布式系统的集成情感大数据分析方法(Spark Feature Weighted Stackin...  相似文献   

12.
基于情感Ontology的资源分析模型   总被引:1,自引:0,他引:1  
对资源分析方法进行了研究,并提出了一种基于情感Ontology的分析方法。首先基于“知网”构建情感Ontology,然后基于情感Ontology抽取资源分析的特征词汇并判断其情感倾向性,最后根据抽取的特征词汇对整篇文本的情感倾向进行分析。实验结果表明,在以人工标注做Baseline的基础上,利用情感Ontology抽取特征词汇的资源分析方法可以使情感识别的准确率达到78.87%。  相似文献   

13.
该文定义了一种用于细粒度意见挖掘的情感本体树结构,并基于细粒度意见要素抽取技术提出本体树的自动构建方法。重点研究了评价搭配抽取算法、搭配倾向预测算法以及特征聚合算法,并在解决搭配倾向预测及特征聚合问题时引入了互联网资源的自然标注性。在COAE2011实验3评测数据集上的实验结果证明了该算法在评价搭配抽取、搭配倾向预测上都取得了很好的效果。  相似文献   

14.
特定方面情感分析已经成为自然语言处理领域的研究热点,其通过学习文本上下文的信息判别文本中特定方面的情感极性,可以更加有效地帮助人们了解用户对不同方面的情感表达.当前,将注意力机制和神经网络相结合的模型在解决特定方面情感分析任务时大多仅考虑单一层面的注意力信息,并且卷积神经网络无法获取全局结构信息、循环神经网络训练时间过长且单词间的依赖程度随着距离增加而逐渐减弱.针对上述问题,提出一种面向双注意力网络的特定方面情感分析(dual-attention networks for aspect-level sentiment analysis, DANSA)模型.首先,引入多头注意力机制,通过对输入进行多次不同的线性变换操作,获取更全面的注意力信息,同时,多头注意力机制可以实现并行化计算,保证了DANSA的训练速度.其次,DANSA引入自注意力机制,通过计算输入中每个单词与其他所有单词的注意力得分获取全局结构信息,并且单词间的依赖程度不会受到时间和句子长度的影响.最后,融合上下文自注意力信息与特定方面单词注意力信息,共同作为特定方面情感预测的依据,最终实现特定方面情感极性的预测.相比结合注意力机制的神经网络,DANSA弥补了注意力信息单一问题,不仅可以有效获取全局结构信息,还能够实现并行化计算,大大降低了训练时间.在SemEval2014数据集和Twitter数据集上进行实验,DANSA获得了更好的分类效果,进一步证明了DANSA的有效性.  相似文献   

15.
肖宇  许炜  夏霖 《计算机科学》2012,39(2):34-37,46
意见领袖对网络舆情的产生和发展有着重要的指引作用,挖掘和识别网络社区中的意见领袖有重要的现实意义。结合聚类算法和分类算法的优势,提出一种基于话题内容分析的兴趣团体发现方法,以有效识别出兴趣团体。并通过分析用户回帖情感倾向来计算用户间链接的权重。在此基础上,提出了一种新的LeaderRank意见领袖发现算法,通过实验证明该算法能有效提高意见领袖挖掘的准确度。  相似文献   

16.
在传统检索模型的基础上,结合本体的概念,提出一种基于本体语义树的主题空间向量模型,该模型能够用语义概念树描述一个主题,与传统基于关键词描述主题的方法不同,它能够描述概念之间的简单语义关系.在此基础上,给出HTML页面内容与主题相关度的计算方法.在分析URL的相关度时,不仅分析链接锚文本与主题相关度,还结合了改进的Pag...  相似文献   

17.
当前,微博意见领袖识别的研究方法纷繁多样,常见的方法有:对用户的个性化特征进行综合分析的方法和基于社交网络结构的分析方法。这些方法大多只考虑了用户的特征,未考虑用户之间的互动行为,或者未考虑 微博文本的情感因素。为此,提出了一种基于微博情感分析的微博意见领袖识别方法。首先,在基于合成情感词典的词频统计结果的基础上,利用支持向量机对微博博文进行情感分析;然后,将变异系数法用于微博属性权重的计算,以体现微博的影响力;最后,利用改进的PageRank算法在微博用户转发关系网络中预测用户影响力的扩散过程,计算用户最终影响力的大小。在新浪微博数据集上通过实验评测该方法的性能,结果表明该方法能够有效提高识别性能。  相似文献   

18.
提出一种利用国家超级计算济南中心的千万亿次计算平台对整个城市范围内的公共Wi-Fi无线网络进行信息获取和奥情分析的系统,它基于非介入式的无线数据包捕获技术、Web页面还原与容错修复技术、多种文本挖掘技术和海量数据处理技术,可对公共W i-Fi无线网络中的各种非法行为进行取证,对网络奥情进行准确分析和预测,可为相关部门的网络典论导向工作提供全面准确的参考。  相似文献   

19.
深度网络模型在微博情感倾向性分析过程中难以有效利用情感特征信息,为此,提出一种基于多样化特征信息的卷积神经网络(MF-CNN)模型。结合词语多样化的抽象特征和2种网络输入矩阵计算方法,利用句中的情感信息,以优化情感分类效果。在COAE2014和微博语料数据集上进行文本情感分析,结果表明,MF-CNN模型的情感分类效果优于传统的分类器和深度卷积神经网络模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号