首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
受网上各种信息的影响,高校大学生对社会诸多现象、现实和问题等反应敏感,易受到错误言论的蒙蔽和误导。针对高校网络舆情监测与预警手段方面的严重不足,开发了一个基于网络信息挖掘技术的高校网络舆情监测系统,系统利用网络蜘蛛技术、中文分词技术和文本聚类技术,通过对互联网信息进行采集、处理,舆情识别分析,实现了舆情热点与话题信息的推送与跟踪功能,可进一步分析舆情内容的观点与态度问题,筛选并判定各级别网络舆情的发生,从而进行公共危机和热点事件的监测和预警。  相似文献   

2.
目前的网络舆情分析系统一般采用输入的关键词进行检索,无法及时发现未知的热点事件。针对这一问题,设计实现了一个具有实用意义的舆情信息分析系统,并将改进的K-MEANS算法应用于文本聚类来自动发现当前的热点主题。运行结果表明,系统可以及时发现热点话题并对事件实时追踪。  相似文献   

3.
针对互联网热点信息发现的需求,提出一种基于先分类再聚类的互联网信息热点发现及分析系统构建方法.通过对互联网样本信息文本的特征提取,构建文本向量空间模型,使用Maxent最大熵分类模型对文本进行分类,对分类结果使用OPTICS聚类算法获取文本热点簇,最终获取有效热点信息.实验证明,通过先分类再聚类的方法可以有效避免语义类别不同但字面意义混淆的文章对聚类算法的影响,有效提高聚类结果的精度和运算效率.  相似文献   

4.
面向舆情分析的短文本频繁模式聚类算法   总被引:1,自引:0,他引:1  
基于短文本的舆情分析是当前信息挖掘与情感分析领域的研究重点,针对网络环境中大量的短文本信息的鲜明特点,本文突破了传统基于词的分类方法,提出一种基于后缀数组频繁模式发现的聚类算法,利用后缀数组频繁模式精确去重算法得到关键词库,结合局部性原理对位置点聚类之后作有意义字串挖掘,进而进行文本舆情分析,以便及时动态了解网络群体的情感方向以及社会舆情热点。  相似文献   

5.
轨迹聚类算法可以广泛地应用在交通管理中,利用轨迹聚类算法找出车辆轨迹热点区域对交通部门规划管理交通出行有重要指导意义。目前的轨迹聚类算法多以空间相似性进行度量,不能体现不同时间段的轨迹热点区域划分情况。针对上述问题,该文结合时间因素,提出了一种时空轨迹的热点区域提取算法。首先,对传统的密度峰值聚类算法进行了改进,考虑了计算密度的线性和非线性部分,改进了密度的计算方法;同时,改进了簇类中心的选取方法,能够自动地选取簇类中心;在此基础上,提出了聚类融合算法,过滤了不合适的聚类和多余聚类;最后利用DB检验量来检测提取效果。实验结果表明,相比于传统的聚类算法,本文算法能更有效地提取时空轨迹的热点区域。  相似文献   

6.
针对传统舆情检测方法存在检测指标单一、适用面窄、效率不高、预测滞后和结论不准确等缺陷,提出一种基于网民行为的倾向性密度聚类方法.采用网民行为与心智倾向的超大规模数据集,设计分布式架构的密度聚类算法.仿真结果表明,分布式聚类架构适用于超大规模的网民行为与心智倾向的预测需要,能够高效提取聚簇中心和实现仿真性链路预测目标,显著提高舆情新动向预测的实际功效.  相似文献   

7.
基于知识本体和可比语料库方法,针对俄汉敏感网络新闻话题发现问题开展研究。首先,分析俄汉敏感网络新闻可比语料话题特征并抽取话题要素,设计话题本体的总体框架,建立话题类和属性关系用于话题发现实验;其次,设计基于话题本体的俄汉网络新闻话题发现算法,包括跨语言文本相似度算法和话题发现算法;最后,将设计好的算法结合本体中的话题实例开展话题发现实验,实验验证本体方法和话题发现算法的有效性。该成果可为面向网络空间安全的俄汉跨语言话题监测、话语分析和舆情监控等研究提供帮助。  相似文献   

8.
以江苏省为例,采集了公路交通相关网络文本信息数据,从季度、年度、重大事件3个角度分别进行了舆情监测和分析,梳理了热点舆情的内容及走势变化,并基于长短期记忆网络设计了一种新的公路交通舆情情感分析方法,其准确率、查准率、召回率和AUC值分别达到96.1%、84.2%、88.9%和0.904. 最后构建了一套公路交通舆情监测系统,可以展示公路交通舆情关键词云图,并分析舆情情感倾向,为公路管理部门开展工作提供参考.  相似文献   

9.
考虑网络事件的时间距离,基于半结构化网页中不同位置特征项重要程度的不同,提出改进的single-pass文本聚类算法single-pass*,优势在于对Web文本不同位置特征项的加权处理,仅需计算新文档与同类别种子文档间的相似度。实验结果表明,相比single-pass,改进算法极大减少了漏检率和错检率,降低了由于新文本流内文档进行相似度计算导致系统性能的下降,平均提高Web文本聚类效率40%。将聚类后的Web文本应用于网络舆情分析,进行主题关注度分析和话题热度特性分析。  相似文献   

10.
在分析微博舆情热点监测研究局限的基础上,从信息传播角度提出一种基于社团信息传播能力分析的微博舆情热点监测方法。该方法首先基于微博用户间信息交互构建微博信息交互网络;然后采用快速Newman社团发现算法挖掘信息交互网络中的信息传播社团;最后根据用户传播影响力和用户间交互紧密度对社团的传播能力进行评估,并通过对具有较强信息传播能力社团中信息交互的监测实现微博潜在舆情热点的挖掘。实验结果表明,微博信息传播社团的信息传播能力与热点微博信息在社团中的真实传播效果具有较高的拟合度,通过对强传播能力社团中信息交互情况的实时监测,可发现潜在舆情热点信息。  相似文献   

11.
Blog opinion retrieval aims to find blogs with opinionated information related to a given topic. Its main problem is to compute the opinion score, which balances topic relevance and opinion relevance. To deal with this problem a generative model deduced by a Bayesian approach is pro-posed, and an improved mixture model is proposed to estimate the opinion relevance between a blog and a given topic in our retrieval framework. Moreover, pointwise mutual information is used to expand sentiment words for different topics based on a general sentimental lexicon. The correlation between topic and candidate words is applied in the process of both expanding sentiment words and estimating sentence opinion scores. Experimental results show that the proposed approaches improve upon the state-of-the-art opinion retrieval method on TREC2010 dataset.  相似文献   

12.
表情符号已成为网络语言重要组成部分,是分析社交媒体情感的主要特征之一.目前分析社交媒体情感符号的方法多针对Emoji,对颜文字的情感倾向没有相应分析.为获取中文媒体的多维度情感并分析热点话题的群体情感走向,本文以微博为例提出一种新的融合表情符号与短文本的多维情感分类方法.在该框架中,采用深度学习模型分析文本与Emoji组合部分、颜文字部分,分别计算两部分的7种情感强度,挖掘各部分与情感标签的深层次关联,并设计计算模型来反映语句包含的多维情感属性,实现对语句多维情感强度的检测.实验选择NLPCC2014数据集和爬取的带有颜文字的微博数据集进行验证,实验证明当文本与Emoji组合、颜文字占比分别为0.6和0.4时情感分类效果最好,且含颜文字的语句情感分类性能指标始终高于不含颜文字的语句,这表明融合表情符号和短文本的形式有效提高了情感检测精度.该方法为研究群体情感趋势提供了更细粒度的分析,为中文社交媒体的情感分析提供了新思路.  相似文献   

13.
基于图划分的网状高阶异构数据联合聚类算法   总被引:1,自引:0,他引:1  
目前已有的高阶联合聚类算法主要集中于分析星型高阶异构数据,然而实际应用中,存在大量网状高阶异构数据。为了有效挖掘网状高阶异构数据内部隐藏的结构,本文提出一种基于图划分的高阶联合聚类算法(简称为GPHCC),该算法将网状高阶异构数据的聚类问题转化为多对二部图的最小正则割划分问题。为了降低计算复杂度,将此优化问题转化为半正定问题求解。实验结果表明GPHCC算法优于目前已有的5种二阶联合聚类算法和5种高阶联合聚类算法。  相似文献   

14.
针对传统预测方法无法有效预测Web舆情的长期趋势中拐点的不足,提出一种长期趋势预测方法.该方法首先通过周期分析和层次聚类为每类已发生舆情事件的发展趋势建立类模型库,然后通过对待预测舆情事件已知发展趋势进行自适应变换后,应用最小二乘法从相应的类模型库中选取均方误差和最小的模型来预测该事件的未来发展趋势.实验证明,与传统方...  相似文献   

15.
网络舆情吸引着广大人民的目光,引导着事件的发展。为了解决公共场所互联网舆情监听的难题,借鉴以太网网络监听的原理和组成,设计了由中心控制节点和监听节点构成的互联网监听模型。模型采用分布式节点结构、端口镜像方式进行部署,利用零拷贝技术进行数据捕获和封装,通过构造特征码库和异常事件响应机制对敏感信息进行报警处理。采用本模型可以对宾馆、网吧、机场、车站等公共场所进行网络监听,把握舆论走向。  相似文献   

16.
文本情感分类是近年来自然语言处理领域的研究热点,旨在对文本蕴含的主观倾向进行分析,其中,基于特定目标的细粒度情感分类问题正受到越来越多的关注。在传统的深度模型中加入注意力机制,可以使分类性能显著提升。针对中文的语言特点,提出一种结合多跳注意力机制和卷积神经网络的深度模型(MHA-CNN)。该模型利用多维组合特征弥补一维特征注意力机制的不足,可以在没有任何先验知识的情况下,获取更深层次的目标情感特征信息。相对基于注意力机制的LSTM网络,该模型训练时间开销更小,并能保留特征的局部词序信息。最后在一个网络公开中文数据集(包含6类领域数据)上进行实验,取得了比普通深度网络模型、基于注意力机制的LSTM模型以及基于注意力机制的深度记忆网络模型更好的分类效果。  相似文献   

17.
针对方面级情感分析任务不能充分兼顾句法全面性与语义关联性,且大多数研究中使用的图卷积仅考虑信息自上而下的传播,忽略了信息自下而上的聚合等问题,本文提出了基于注意力与双通道网络的情感分析模型.该模型在扩展依存表示的同时使用自注意力获取具有语义关联的信息矩阵,使用双通道网络结合全局句法与语义关联信息,双通道网络分别侧重于自上而下传播的语义特征与自下而上聚合的结构特征.通道内的图卷积输出会与信息矩阵进行交互注意力起到残差互补的作用,然后通过平均池化完成通道内的任务.最后将基于语义与基于结构的决策融合得到最终的情感分类特征.实验结果表明该模型在三个公开数据集上的准确率与F1值均有提升.  相似文献   

18.
教育舆情是在一定的社会空间内,舆情主体对有关教育的中介性社会事项所持有的社会态度。教育舆情的构成要素主要有主体、客体、中介性教育事项和空间。教育舆情作为舆情的子概念,对其开展内涵研究,一方面有助于教育领域的舆情治理,另一方面标志着舆情研究进入到了一个概念细分的新阶段,充分显现了舆情研究的阶段性特征,有助于进一步推动舆情研究的科学化进程。  相似文献   

19.
近年来长短期记忆网络(LSTM)在文本情感倾向分析方面显示出一定优势,但LSTM提取特征时存在语义不完整、精度不高等问题.研究者往往通过引入卷积神经网络(CNN)来弥补这一缺陷,但仍然未考虑到单词之间的句法依存问题.本文将以增量学习算法为核心的宽度学习(BLS)与LSTM相融合,提出了LSTM-BLS文本情感分析模型,并以2020断崖式降温事件为例,对突发气象灾害发生时公众情感倾向进行分析.结果表明:与基线模型K-means和支持向量机(SVM)相比,LSTM-BLS模型精度分别提高17.23和13.46个百分点;与已有深度模型LSTM、CNN-LSTM相比,本文模型精度分别提高7.13和4.17个百分点.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号