首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 62 毫秒
1.
以微博为代表的社交平台已经成为人们获取信息和发布信息的重要途径,也成为虚假信息滋生的温床。包含虚假信息的微博往往含有明显的情感偏向。文章从情感分析角度出发,提出一种Bert模型结合BI-LSTM模型的虚假信息识别模型(LableBert模型):首先利用情感词典给情感词添加权重,改进Bert的预训练任务,以提升对于隐式情感特征的提取能力,并批量标注被掩盖单词的文本情感极性,以加强对文本中上下文的情感特征获取能力;然后结合BI-LSTM模型进行全连接操作,从而识别虚假信息。实验结果表明,该模型的准确率达到了91.36%,F1值达到了91.03%,相比原Bert模型,该模型的准确率和F1值都有所提升。  相似文献   

2.
针对短文本数据特征少、提供信息有限,以及传统卷积神经网络(convolutional neural network,CNN)和循环神经网络(recurrent neural network,RNN)对短文本特征表示不充分的问题,提出基于串并行卷积门阀循环神经网络的文本分类模型,处理句子特征表示与短文本分类。该网络在卷积层中去除池化操作,保留文本数据的时序结构和位置信息,以串并行的卷积结构提取词语的多元特征组合,并提取局部上下文信息作为RNN的输入;以门阀循环单元(gated recurrent unit,GRU)作为RNN的组成结构,利用文本的时序信息生成句子的向量表示,输入带有附加边缘距离的分类器中,引导网络学习出具有区分性的特征,实现短文本的分类。实验中采用TREC、MR、Subj短文本分类数据集进行测试,对网络超参数选择和卷积层结构对分类准确率的影响进行仿真分析,并与常见的文本分类模型进行了对比实验。实验结果表明:去掉池化操作、采用较小的卷积核进行串并行卷积,能够提升文本数据在多元特征表示下的分类准确率。相较于相同参数规模的GRU模型,所提出模型的分类准确率在3个数据集中分别提升了2.00%、1.23%、1.08%;相较于相同参数规模的CNN模型,所提出模型的分类准确率在3个数据集中分别提升了1.60%、1.57%、0.80%。与Text-CNN、G-Dropout、F-Dropout等常见模型相比,所提出模型的分类准确率也保持最优。因此,实验表明所提出模型可改善分类准确率,可实际应用于短文本分类场景。  相似文献   

3.
为了研究微博传播机制,本文提出一种基于溯源的虚假信息传播控制方法,根据微博转发关系和主题相关性得到级联集合,并结合用户关系网和信息级联关系网确定微博信息的真正发起者。通过文本情感分析和信息级联关系迭代计算节点的影响力指数和从众指数,提取微博信息早期重要参与者。综合发起者和早期重要参与者确定信息源头并进行评估。通过删除优质源头节点和全局高影响力节点来控制虚假信息的传播。在新浪微博数据集上通过实验验证了基于所有溯源节点的虚假信息控制策略效果最优。  相似文献   

4.
针对网络恶意登录异常检测过程中对用户操作日志的特征提取准确率低、泛化性差所导致的网络攻击识别率低、网络管理员反馈不及时等问题,结合注意力机制以及循环神经网络,提出一种基于深度学习的网络恶意登录异常检测方法.该方法针对不同类型的用户操作日志,使用了word-level和char-level两种编码方式;使用LSTM模型提取用户操作日志中所蕴含的特征信息,以识别用户操作日志中的正常行为;通过注意力机制使模型更加关注操作正常的特征信息,同时过滤冗余操作,得到用户操作评分;设定阈值判断该日志流是否为恶意登陆,并同时反馈给网络管理员.实验结果表明,本文所提方法可针对不同用户日志进行编码,特征提取准确率高,网络恶意登陆异常检测的F1-Score达到了0.976.  相似文献   

5.
为了提高具有关联工单数据的录音文本的分类精确率,根据录音文本及关联数据的特点,设计基于深度学习的录音文本分类方法. 针对录音文本,通过双向词嵌入语言模型(ELMo)获得录音文本及工单信息的向量化表示,基于获取的词向量,利用卷积神经网络(CNN)挖掘句子局部特征;使用CNN分别挖掘工单标题和工单的描述信息,将CNN输出的特征进行加权拼接后,输入双向门限循环单元(GRU),捕捉句子上下文语义特征;引入注意力机制,对GRU隐藏层的输出状态赋予不同的权重. 实验结果表明,与已有算法相比,该分类方法的收敛速度快,具有更高的准确率.  相似文献   

6.
在基于图卷积网络的推荐模型中,图卷积对仅包含编号信息的输入节点进行信息聚合会引发严重的瓶颈问题,影响推荐精度.为缓解此问题,考虑通过辅助信息丰富节点特征,提出了一种融合文本信息的轻量级图卷积网络推荐模型.模型把卷积神经网络提取出文本评论特征添加到图的节点嵌入中.为了简化图卷积网络结构,采用轻量级图卷积框架将融合的特征信息在用户-电影项目图上线性传播来学习用户和电影项目的嵌入,并将所有图卷积子层上特征嵌入的加权总和作为最终特征输出,用于预测评分.3个实际数据集上的实验结果表明,该方法可以缓解信息聚合瓶颈问题,提高推荐的准确度,并且模型可以缓解推荐中的冷启动问题.  相似文献   

7.
针对文本匹配过程中存在语义损失和句子对间信息交互不充分的问题,提出基于密集连接网络和多维特征融合的文本匹配方法. 模型的编码端使用BiLSTM网络对句子进行编码,获取句子的上下文语义特征;密集连接网络将最底层的词嵌入特征和最高层的密集模块特征连接,丰富句子的语义特征;基于注意力机制单词级的信息交互,将句子对间的相似性特征、差异性特征和关键性特征进行多维特征融合,使模型捕获更多句子对间的语义关系. 在4个基准数据集上对模型进行评估,与其他强基准模型相比,所提模型的文本匹配准确率显著提升,准确率分别提高0.3%、0.3%、0.6%和1.81%. 在释义识别Quora数据集上的有效性验证实验结果表明,所提方法对句子语义相似度具有精准的匹配效果.  相似文献   

8.
将时效网络引入虚假信息传播研究中,提出一种通过时效模体度刻画传播网络的方法来探究虚假信息的传播机制。该方法将传播网络的结构特性和信息的时间属性相融合,使用多个真实数据集检验了该方法在虚假信息检测中的普适性。数据结果表明,真假信息在不同的时间尺度下时效模体度的变化规律不同,在大时间尺度上虚假信息比真实信息的传播速度更快且传播深度更深,利用基于时效模体度的方法可以更准确地检测出虚假信息。该研究揭示了虚假信息的多时间尺度传播机制,可用于预防虚假信息的传播。  相似文献   

9.
为充分利用信号的时序相关性特征,增强模型对数据信息的全面挖掘能力,以进一步提高卷积神经网络(CNN)诊断精度,本文将CNN与善于处理数据时序相关性特征的门控循环单元(GRU)相结合,提出了一种新的齿轮箱故障诊断模型。CNN通过端对端的方式提取数据空间特征,并将提取的特征作为GRU的输入进一步提取时空特征,最后将GRU提取的时空特征作为SoftMax的输入进行故障识别。两组齿轮箱实验数据分析结果显示:平均故障诊断精度分别可达99.86%和99.85%,与其它现有模型的结果对比体现了本文模型的有效性和优越性。  相似文献   

10.
虚假评论的检测与治理,对净化网络环境具有重要的意义。针对现有的虚假评论检测方法收敛速度慢、准确率低的问题,提出一种融合评论情感特征的虚假评论检测方法。首先,基于预先构建的情感词典,设计情感特征抽取方法抽取情感特征;其次,引入 Transformer模型对融合情感特征后的嵌入表示提取特征向量;最后,将特征向量送入全连接层并利用 softmax函数实现真实评论与虚假评论分类。采用 Amazon数据集,设计实验验证了基于情感词典所提情感特征的有效性,在融合情感特征后准确率提升了1.19百分点;同时与深度学习ISTM方法相比,该方法检测准确率提高0.59百分点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号