共查询到16条相似文献,搜索用时 125 毫秒
1.
事件关系检测是一项面向文本信息流进行事件关系判定的自然语言处理技术。事件关系检测的核心任务是以事件为基本语义单元,通过分析事件之间的语义关联特征,实现事件逻辑关系的识别与判定,包括关系识别(即识别有无逻辑关系)和关系判定(即判定逻辑关系类型,如“因果”关系)。目前,专门面向事件的逻辑关系分析与处理,尚未形成一套完整的研究体系。针对这一问题,该文借助篇章分析、事件抽取和场景理解等相关领域中的概念与数据资源,尝试建立一套事件关系检测的任务和研究体系,包括任务定义、关系体系划分、语料采集与标注、评价方法等。同时,该文着重分析和对比了事件关系检测与篇章关系检测的差异,并给出了事件关系检测任务的难点与挑战。 相似文献
2.
事件关系检测是一项面向事件之间逻辑关系的自然语言处理技术。事件关系识别的核心任务是以事件为基本语义单元,通过分析事件的篇章结构信息及语义特征,实现事件逻辑关系的深层检测。该文首次建立一套事件关系检测的任务和研究体系,包括任务定义、关系体系划分、语料采集与标注、评价方法等。同时,该文提出了一种跨场景推理的事件关系检测方法,该方法认为,具有相同事件场景的“事件对”,往往具有相同的事件关系类型。该文提出的基于跨场景推理的事件关系检测方法在针对四大类事件关系类型的检测精确率为54.21%。 相似文献
3.
4.
触发词的识别在事件检测任务中起着至关重要的作用。目前没有越南语触发词标记语料,而中文触发词标记语料较为丰富,根据表达相同观点但语言不同的句子通常有相同或相似的语义成分这一特征,该文提出一种基于中文触发词指导的越南语新闻事件检测方法。首先采用对抗学习的方法将两种语言映射到同一语义空间下,然后将映射后的中文触发词嵌入指导模型识别越南语新闻中的触发词信息,最后进行事件类型的分类。通过在越南语新闻事件检测的实验结果表明,在中文触发词指导下的越南语新闻事件检测取得了较好的效果。 相似文献
5.
6.
7.
事件抽取旨在把含有事件信息的非结构化文本以结构化的形式予以呈现。现有的基于监督学习的事件抽取方法往往受限于数据稀疏和分布不平衡问题,具有较低的召回率。针对这一问题,该文提出一种利用框架语义优化事件抽取的方法,引入框架类型作为泛化特征,在此基础上进行框架类型和事件类型的映射,然后结合框架类型识别模型和事件类型识别模型进行协作判定,以此优化事件抽取的召回性能。实验结果显示,针对触发词(事件类型)识别任务,相较于仅使用事件类型识别模型,该文提出的框架语义辅助的事件类型识别模型能够提高抽取召回率6.44%(5.74%),提高F值1.45%(0.83%)。 相似文献
8.
事件识别是事件抽取的子内容,其主要任务是找出文本中的事件触发词。针对现有的事件识别方法对单一特征的利用还不够充分的问题,通过构建包含正负特征的触发词表,提出一种基于正负加权的事件识别方法。定义一种关联词特征,该特征对事件识别有较好的效果;根据单一特征所属的词是否为触发词将特征分为正特征或负特征,并将正负特征结合起来进行触发词识别,提升单一特征在事件识别时的作用。在此基础上,将正负关联词特征、正负词性特征以及正负依存关系特征结合起来进行触发词识别,进一步提升事件识别效果。实验结果表明,基于正负加权的事件识别方法得到了比较理想的效果。 相似文献
9.
10.
命名实体识别是自然语言处理中的一项基础任务。通过基于词典的方法增强词内语义和词边界信息是中文命名实体识别的主流做法。然而,汉字由象形字演变而来,汉字字形中包含着丰富的实体信息,这些信息在该任务中却很少被使用。该文提出了一个基于词典和字形特征的中文命名实体识别模型,将词信息和结构信息统一地结合起来,提高了实体匹配的准确性。该文首先通过SoftLexicon方法丰富语义信息,并使用改进的部首级嵌入优化字符表示;然后通过门卷积网络加强了对潜在词和上下文信息的提取;最后在四个基准数据集上实验,结果表明与传统模型和最新模型相比,基于词典和字形特征的模型取得了显著的性能提升。 相似文献
11.
事件关系分类是一项研究事件之间存在何种逻辑关系的自然语言处理技术。针对事件关系分类任务中训练语料不足的问题,提出了基于Tri-Training的事件关系分类方法。该方法首先根据已标注的语料训练三个不同的分类器,以多数投票的方式从未标注集中抽取置信度较高的样本对训练集进行扩充,然后利用新的训练集重新训练分类器,反复迭代,不断完善分类模型,最终达到提升事件关系分类性能的目的。实验结果表明,以F1值为评价标准,基于Tri-Training的事件关系分类方法在四大类事件关系上的分类性能为64.36%。 相似文献
12.
基于事件项语义图聚类的多文档摘要方法 总被引:2,自引:2,他引:0
基于事件的抽取式摘要方法一般首先抽取那些描述重要事件的句子,然后把它们重组并生成摘要。该文将事件定义为事件项以及与其关联的命名实体,并聚焦从外部语义资源获取的事件项语义关系。首先基于事件项语义关系创建事件项语义关系图并使用改进的DBSCAN算法对事件项进行聚类,接着为每类选择一个代表事件项或者选择一类事件项来表示文档集的主题,最后从文档抽取那些包含代表项并且最重要的句子生成摘要。该文的实验结果证明在多文档自动摘要中考虑事件项语义关系是必要的和可行的。 相似文献
13.
针对传统基于内容相似度的事件关系计算方法不能分析出事件间的潜在关系的问题,提出了基于FCA的事件关系计算方法。该方法利用根据话题的三层结构模型,对话题中的事件进行属性提取,并依据特征频率因子进行属性选择。利用两个事件之间的属性关系建立形式背景,以此为基础形成概念格。用基于概念格的相似度分析发现事件之间潜在。实验证明了这种方法的有效性。 相似文献
14.
事件分类研究一直是计算机科学和语言学等学科的核心研究内容,针对动词语义层面上的分类问题,研究者们提出了不同的分类标准,而根据这些分类标准对动词进行分类会产生分类有交叉和分类粒度粗等问题。一个动词通常表示一个过程事件,该文以汉语世界中经常发生的过程事件为语义分类对象,从事件的定义中提取事件的特征属性,并给每个特征属性赋予权重,利用特征属性对顶层事件类包含的事件进行分类。该文采用框架的形式对事件进行语义描述,框架内容由事件的特征属性和私有属性组成。重点以“传播”类事件为例来阐述该文的分类方法,通过实际操作发现,利用该分类方法,可以得到一个比较清晰的事件语义分类结构。该文用描述逻辑来对事件及事件之间的分类关系进行形式化表示。根据该事件分类体系,可以有效获取事件属性相关的常识知识。 相似文献
15.