首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
马力  宫玉龙 《电子科技》2014,27(11):180-184
对文本情感分析的研究现状与进展进行总结。从情感分析的任务情感分类、情感检索、情感抽取3个方面详细介绍了相关研究和技术方法,重点阐述了基于语义的情感词典分类方法和基于机器学习的情感分类方法,并介绍了文本情感分析的评测,提出了未来的研究方向。  相似文献   

2.
王亚珅  黄河燕  冯冲  刘全超 《电子学报》2016,44(10):2459-2465
随着社交媒体的发展及成熟,每天在互联网环境中都会产生大量的用户评论信息。抽取评价短语、评价对象和观点持有者等情感要素,已经成为了中文观点挖掘和情感分析的重要先决任务。针对中文情感要素抽取任务,本文提出了一个统计和规则相结合的级联模型,主要贡献包括:(1)针对汽车领域评论信息,构建情感要素标注语料库和相关词典;(2)对于以往研究较少关注的中文评价短语,本文详细分析阐述其定义和分类;(3)结合统计和规则,分别针对评价短语和情感要素提出级联抽取策略。实验结果充分证明了该级联模型的有效性,相比较于其它基于规则的情感要素抽取算法有效提升了召回率,同时为后续社交媒体情感分析任务提供了有力的支持。  相似文献   

3.
刘艳文  魏赟 《电子科技》2020,33(7):12-16
LDA主题模型在提取特征时缺乏对词语关联及相关词对的理解,这会影响情感极性分类的准确率。针对这一问题,文中提出一种在LDA主题模型中引入特征情感词对抽取方法的新模型,以改善特征情感词对的抽取效果。利用依存句法分析设计特征情感词对的识别方法,随后将识别方法作为约束条件引入LDA模型对特征情感词对进行抽取。通过吉布斯采样进行参数计算,给出了模型的生成过程。最后利用随机森林分类方法对文本进行情感极性分类。为验证文中模型的有效性,将其和另外两种模型一起进行实验,当主题个数为20时,文中所提模型分类的准确率、召回率、F值分别为81.54%、83.13%和82.33%,显著高于另外两种模型。  相似文献   

4.
针对责任人抽取任务存在类别不平衡、样本量小、数据分布不一致、段落过长的问题,文章提出了结合条件随机场(CRF)以及词注意力机制的混合机器阅读理解(MRC)模型,该模型具备传统MRC模型的优点,可以通过设计多个query解决单个模型抽取重叠词的问题,同时也可通过加入相关query扩充数据集提升模型鲁棒稳定性。研究表明,所提出的混合MRC模型在采用适当策略下可大幅提升责任人抽取任务结果。该模型也可推广到其它要素抽取任务中。  相似文献   

5.
针对序列标注标签预测空间大导致模型预测效果较差的问题,提出一种基于BERT-BiLSTM-Fusion的多方面抽取及情感分析模型。采用跨度预测的方法进行方面词抽取与方面词情感预测分类并联合训练,通过Bert预训练语言模型得到文本嵌入表示,使用BiLSTM学习观测序列上的依赖关系增强学习位置信息,提高模型抽取效果。对Bert预训练语言模型的每一层输出特征进行特征融合,提高模型的情感极性分类效果,并且在三个公开数据集Laptop、Restaurant、Twitter上设计对比实验以及消融实验。实验结果显示,BERT-BiLSTM-Fusion模型的F1值分别达到了66.72%、78.44%、62.10%,且高于对比模型,表明了所提出模型的有效性。  相似文献   

6.
针对现有5G网络故障诊断的准确率和运维效率不高的问题,提出了一种基于数据和知识的5G网络故障诊断算法。首先,利用图卷积神经网络(graph convolutional network,GCN)训练5G网络故障数据集,得到故障诊断模型;然后,对多源数据源进行知识整合、知识抽取、知识融合和表示,构建一个5G网络故障知识图谱(knowledge graph,KG);最后,利用知识图谱分析故障诊断模型输出结果,生成故障报告,进而提高故障诊断模型输出的可解释性。所提方法为5G网络故障诊断提供了一种新的准确而高效的解决方案,实验表明,该故障模型准确率达到了95%。此外,5G网络故障知识图谱能够为运维人员提供支持,助力分析故障原因。  相似文献   

7.
运用人工智能技术对裁判文书进行司法知识抽取,是智慧司法领域的重要研究方向.文中针对传统的实体-关系抽取模型中对复杂关系和重叠关系识别不够准确的问题,面向裁判文书数据提出了一种基于级联二进制标记框架的司法知识抽取方法.对裁判文书中实体抽取和关系抽取两个任务进行了模型设计,并基于盗窃罪案由的裁判文书开展了算法实验,经实验验...  相似文献   

8.
实体及关系抽取是实现海量数据知识化的关键,而现有实体及关系抽取方法应用于垂直领域时,表现出的效果很难达到实装应用水平。针对武器装备领域,文中在分析该领域文本数据特征的基础上,提出基于预训练模型与规则知识结合的武器装备实体及关系抽取方法,由实体抽取和关系抽取两个阶段组成。在实体抽取阶段,首先,利用BERT+BiLSTM+CRF模型完成武器装备实体的识别;然后,通过规则知识对领域性实体补充抽取。在关系抽取阶段,首先,利用BERT+BiGRU+CNN模型抽取武器装备实体间关系;然后,经过滤调模块对实体间关系抽取结果过滤和调整;最后,设计强领域性的关系抽取规则,用于实体间关系的补充抽取。在仿真数据集上对本文方法评测,结果表明在实体识别和关系抽取上的F1值分别为96.4%和95.1%,与基线相比均提升了约10%。同时,文中提出的实体及关系抽取方法可作为一种通用解决方案,推广至其他垂直领域。  相似文献   

9.
上下位关系抽取是知识图谱构建的关键环节,目前常用的基于模板和分布式的方法存在可移植性差、召回率低等不足。针对这些问题,提出了一种基于多通道特征融合的上下位关系抽取方法,通过预训练词嵌入、双向LSTM和依存句法树结果编码三个通道来构建模型编码器。首先,提出了上下位关系抽取整体框架,包括数据挖掘与标注模块、特征抽取模块、候选句打分模块及结果排序模块。然后,针对特征抽取模块,提出了融合句法依存关系、上下文特征以及预训练特征的自适应编码方法;针对句子打分模块,提出了包含编解码器结构的网络模型。最后,通过对准确率、召回率、查全率进行消融实验,表明所提出的模型具有较好的有效性和更好的可解释性。  相似文献   

10.
评价对象抽取的研究难点在于如何精确地表示大范围的上下文信息.本文针对微博观点句,采用了基于双向循环神经网络(BRNN)的方法来抽取评价对象并对评价对象的情感倾向进行判定.BRNN的隐藏层对上下文进行了抽象,如果经过良好地训练,就能在循环处理句子时有效地表示远距离的有序上下文信息,而无需对上下文窗口长度进行限定.本文选择了词、词性、依存句法树以及产品词典等特征构建了BRNN模型.通过实验发现,上述4种特征组合获得了最优实验结果,通过与CRF模型的对比,本文提出的方法在相互覆盖模式下F值比CRF模型高出0.61%,验证了本文方法的有效性.本文方法在COAE2015任务3的资源受限评测任务中,获得了最好结果.  相似文献   

11.
实体关系抽取能够从文本中提取事实三元组信息,这对于构建大规模的知识图谱是十分重要的。在现有的研究中,通常以先进行实体识别,而后进行关系分类或者进行统一标注的方式来完成这一任务,虽然这些方法能够使关系抽取任务变得更易实现,并且模型的网络框架灵活性更高,但是也存在误差积累和暴露误差等问题,且对于关系抽取中的关系重叠和实体嵌套等重难点问题不能够很好的处理。为了解决上述存在的问题,文章构建一种基于深度学习的中文实体关系联合抽取模型。该模型由基于评分的分类器和特定关系的角标记策略以及分区过滤网络构成,首先通过分区过滤网络,将输入的文本划分成三个分区,实体分区和关系分区以及共享分区,能够确保实体识别任务和关系抽取任务进行更好的双向交互;接着应用特定关系的角标记策略来解码实体信息,最后通过一个基于评分的分类器来输出事实关系三元组。实验表明,提出的方法能够改善传统方法带来的误差积累和交互缺失以及实体冗余等问题,提高了三元组抽取的准确率。  相似文献   

12.
针对网络舆情情感分析主题词抽取不精确和文本静态化分析问题,论文提出了一种基于时间序列的方面级网络舆情动态情感演化模型ARMA-ALEE。通过方面级情感分类模型获取方面词和情感极性值,并对方面词使用过滤算法优化,再通过困惑度和JS散度确定最终方面词个数,进一步地还基于ARMA时间序列模型对方面词、方面词强度和方面词相关性的ARMA-ALEE模型动态地进行网络舆情情感演化分析。实验表明,该模型的情感演化研究取得了较好的结果。  相似文献   

13.
自然语言理解任务的主要目标是运用自然语言处理的相关方法,对用户发出的语句进行解析,转化成结构化的语义表示.本文重点研究了基于语义槽抽取的自然语言理解方法.在基于语义槽抽取的自然语言理解任务中,任务的输入是用户的指令型语句,输出为指令的语义槽实体标注序列,如出发日期、出发地点等,故可将语义槽抽取任务看作类似于命名实体识别任务,以序列标注任务的方法解决.本文研究提出了基于Bi-LSTM-CRF模型的语义槽抽取方法,在英文语料ATIS上进行了实验.实验结果表明,基于Bi-LSTM-CRF网络的方法相比于传统机器学习的基准方法,结果得到了大幅度的提升.对于模型识别的结果,研究中采用F1值进行评价.  相似文献   

14.
基于隐马尔可夫模型的中文文本事件信息抽取   总被引:2,自引:2,他引:2  
提出了一种基于隐马尔可夫模型的中文文本事件抽取方法,该方法首先通过触发词探测从文本中发现特定的候选事件语句,然后利用隐马尔可夫模型从这些语句中抽取每个候选事件的事件要素,为每一类事件要素构建一个独立的隐马尔可夫模型用于该类事件要素的抽取,构建模型的关键是模型结构的学习和参数估计。实验结果表明,该方法能较好地实现中文文本事件抽取,较其他方法有更好的抽取性能。  相似文献   

15.
《现代电子技术》2018,(3):75-79
采购评审专家的自动化抽取是采购信息化的重要组成部分。目前就评审专家的计算机辅助抽取提出了不少算法,但在自动化抽取方面的研究和讨论仍然较少。故提出一种面向复杂约束条件的采购评审专家自动化抽取算法。该算法以多项目并行抽取为业务前提,通过重构抽取流程,设立不同抽取任务间的通信机制,优化规则模型,较好地解决了复杂规则下评审专家的自动化抽取问题。该算法已经在中国银联的采购信息化平台上成功实现。  相似文献   

16.
事件抽取作为信息抽取的重要一环,是非结构化文本转化为有价值的结构化文本的主要方式。针对目前事件抽取模型普遍训练时间长、模型体量大等问题,提出了一个基于ABBSAC的中文事件抽取模型。通过ALBERT预训练模型缩减模型体量,采用BiSRU++捕捉文本内部关联信息,并融合注意力机制提升模型精度,最后以CRF的输出作为抽取结果。基于新浪新闻自主构建了语料集,进行了对比实验。在获得较高准确率、召回率以及F1值的基础上,该模型训练速度提高了约10%,模型参数量裁剪了约82%,证明了所提模型的先进性。同时,在ACE05和DUEE基准测评数据集上,与前沿方法相比较,将触发词抽取的F1值分别提升了1.7%、0.3%,将论元角色抽取的F1值分别提升了5.4%、0.1%,有效提升了中文事件抽取任务的效能。  相似文献   

17.
针对工业监控领域数据开发中遇到的业务沟通不畅、模型研发门槛高、维护困难等问题,提出了一种数据抽取框架的设计思路,结合对数据抽取、任务编排、自定义数据源接入的分析和设计,为项目数据抽取工作的实际落地提供借鉴参考。  相似文献   

18.
知识图谱可辅助现场人员处理配电网运行过程中积累的海量异构文本,挖掘高价值运行信息。针对知识图谱构建需求人工标注成本过高的问题,提出一种基于知识增强的远程监督关系抽取方法。利用GloVe编码与Bi-GRU网络对配电网运行语料库的句包进行向量表征;同时,新增外部知识增强模块,通过Attention-GCN模型获取编码文本的句法结构以及非线性关系,实现低成本的关系抽取,解决传统远程监督学习存在的长尾分布及噪声问题,提升关系抽取精度。实验结果表明,该方法在配电网运行信息关系抽取任务中表现优秀,相较于主流模型在精确率上提升6%。  相似文献   

19.
周博学 《信息技术》2022,(4):130-136,142
不同于流水线方式的关系抽取方法,在实体关系联合抽取方式中虽然把实体识别和关系抽取两者结合起来,但损失部分实体特征信息.在以BERT预训练模型为核心的SpERT实体关系联合抽取模型输入阶段,融入置信度较高的词性标注和句法依存关系的先验特征;并在模型的关系抽取层中重用输入信息,为关系抽取任务提供更多的特征;在优化模型的损失...  相似文献   

20.
针对现有的基于表示学习的语音情感计算算法中存在着限制条件单一的问题,且没有证明它们的有效性,提出了一种采用原子表示模型的语音情感识别算法。通过引入一个新的条件,称为原子分类条件。在这种条件下,对正确识别新的测试情感样本有较好的效果。现有的基于表示的分类算法以单一的稀疏表示方法为主,而提出的算法可以结合稀疏表示模型和其他的表示模型。该算法能够放宽适用条件的范围,使得原子表示模型适应更多分类任务。采集并建立了维吾尔语语音情感数据库。在该情感数据库上,分析维吾尔语情感语音的基本声学特征。通过对情感特征空间进行原子表示的映射变换,可以有效表示情感特征空间。经实验结果证明所提出的方法优于传统的方法,在维吾尔语情感语音数据库上达到了64.17%识别率。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号