共查询到20条相似文献,搜索用时 187 毫秒
1.
基于事件的文本表示方法研究 总被引:1,自引:1,他引:0
在传统文本表示模型的研究基础上,针对叙事类文本,考虑以事件作为基本语义单元,并结合图结构表示的
特点,提出了一种基于事件的文本表示方法—事件网络。该方法利用事件和事件间的关系来表示文本,能够较大程
度地保留文本的结构信息及语义信息。实验结果表明,基于该方法的自动摘要取得了较好的效果。 相似文献
2.
3.
4.
针对基于公开新闻数据的重大事件趋势预测研究在文本特征提取上语义理解不足问题,提出基于图卷积网络的重大事件趋势预测方法.利用结构化事件信息构建以事件为中心的语义关联图;按时间片粒度分割出局部事件语义关联图,利用预训练词向量对节点文本初始化特征表示;将带有节点特征的局部事件语义关联图输入图卷积网络,聚合节点邻域信息计算图特征表示并输入到分类器,训练预测模型并输出预测结果.以朝鲜核行为趋势预测问题验证所提出方法的有效性,对测试集(2017年3月~2018年3月)预测准确率达到76.92%,全时间段预测准确率为89.58%.预测结果表明,该方法增强了对文本的语义理解,预测精度优于基于专家知识构建特征的方法. 相似文献
5.
6.
基于事件项语义图聚类的多文档摘要方法 总被引:2,自引:2,他引:0
基于事件的抽取式摘要方法一般首先抽取那些描述重要事件的句子,然后把它们重组并生成摘要。该文将事件定义为事件项以及与其关联的命名实体,并聚焦从外部语义资源获取的事件项语义关系。首先基于事件项语义关系创建事件项语义关系图并使用改进的DBSCAN算法对事件项进行聚类,接着为每类选择一个代表事件项或者选择一类事件项来表示文档集的主题,最后从文档抽取那些包含代表项并且最重要的句子生成摘要。该文的实验结果证明在多文档自动摘要中考虑事件项语义关系是必要的和可行的。 相似文献
7.
基于改进潜在语义分析的跨语言检索 总被引:1,自引:0,他引:1
该文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,建立不同语言之间的对应关系,便于在双语空间中进行检索。该文充分利用医学文献双语摘要语料中的锚信息,通过不同的k值构建多个检索模型,计算每个模型的信任度,使得多个模型都对查询和文本的相似度做出贡献。在语义空间上进行项与项、文本与文本、项与文本之间的相似度计算,实现了双语摘要的跨语言检索,取得了较好的实验效果。 相似文献
8.
9.
自动摘要是解决网络信息过载问题的关键技术之一.在对文本中旬子的特征和句子之间的语义距离分析的基础上,提出了一种基于句子特征和语义距离的自动文本摘要算法.首先计算文档中句子的各个特征权重,在此基础上决定句子的权重;然后,通过句子之间的语义距离计算,修改句子的权重,据此进行排序,权重大的作为文本的主题句;最后,对文摘句进行平滑处理,生成文字流畅的文本摘要.实验表明,该算法在不同的压缩率下生成的摘要接近于人工摘要,具有较好的性能. 相似文献
10.
11.
视频数据中包含丰富的运动事件信息,从中检测复杂事件,分析其中的高层语义信息,已成为视频研究领域的热点之一。视频复杂事件检测,主要对事件中多语义概念进行检测分析,对多运动目标的特征进行描述,发现底层特征与高层语义概念间的关系,旨在从各类视频特征及相关的原始视频数据中自动提取视频复杂事件中语义概念模式,实现“跨越语义鸿沟”的目标。在超图理论的基础上,提出了针对运动目标特征分别构建轨迹超图和多标签超图,并对其进行配对融合,用于检测视频复杂事件。实验结果证明,同其他方法如基于普通图的事件检测方法和基于超图的多标签半监督学习方法相比,新方法在检测复杂事件结果中具有更高的平均查准率和平均查全率。 相似文献
12.
维吾尔语事件伴随关系是维吾尔语语言中常见且重要的关系之一。结合对维吾尔语语言特点的研究,该文提出一种基于深度信念网络的维吾尔语事件伴随关系识别方法,根据维吾尔语语言特性和事件伴随关系的特点,抽取12项基于事件结构信息的特征;同时充分利用事件对所对应的两个触发词之间的语义信息,引入Word Embedding计算两个触发词之间的语义相似度。而后融合两类特征作为DBN模型的输入进行训练,最后将训练结果作为softmax分类器的输入实现维吾尔语事件伴随关系的识别。该方法用于维吾尔语事件伴随关系的识别准确率P为81.89%、召回率R为84.32%、F1值为82.48%。实验结果表明,与支持向量机方法相比,基于DBN模型的方法取得更好的识别效果。 相似文献
13.
事件检测作为事件抽取的一个子任务,是当前信息抽取的研究热点之一。它在构建知识图谱、问答系统的意图识别和阅读理解等应用中有着重要的作用。与英文字母不同,中文中的字在很多场合作为单字词具有特定的语义信息,且中文词语内部也存在特定的结构形式。根据中文的这一特点,文中提出了一种基于字词联合表示的图卷积模型JRCW-GCN(Joint Representation of Characters and Words by Graph Convolution Neural Network),用于中文事件检测。JRCW-GCN首先通过最新的BERT预训练语言模型以及Transformer模型分别编码字和词的语义信息,然后利用词和字之间的关系构建对应的边,最后使用图卷积模型同时融合字词级别的语义信息进行事件句中触发词的检测。在ACE2005中文语料库上的实验结果表明,JRCW-GCN的性能明显优于目前性能最好的基准模型。 相似文献
14.
15.
事件分类研究一直是计算机科学和语言学等学科的核心研究内容,针对动词语义层面上的分类问题,研究者们提出了不同的分类标准,而根据这些分类标准对动词进行分类会产生分类有交叉和分类粒度粗等问题。一个动词通常表示一个过程事件,该文以汉语世界中经常发生的过程事件为语义分类对象,从事件的定义中提取事件的特征属性,并给每个特征属性赋予权重,利用特征属性对顶层事件类包含的事件进行分类。该文采用框架的形式对事件进行语义描述,框架内容由事件的特征属性和私有属性组成。重点以“传播”类事件为例来阐述该文的分类方法,通过实际操作发现,利用该分类方法,可以得到一个比较清晰的事件语义分类结构。该文用描述逻辑来对事件及事件之间的分类关系进行形式化表示。根据该事件分类体系,可以有效获取事件属性相关的常识知识。 相似文献
16.
17.
《Expert systems with applications》2014,41(7):3477-3483
The aim of cross impact analysis (CIA) is to predict the impact of a first event on a second. For organization’s strategic planning, it is helpful to identify the impacts among organization’s internal events and to compare these impacts to the corresponding impacts of external events from organization’s competitors. For this, literature has introduced compared cross impact analysis (CCIA) that depicts advantages and disadvantages of the relationships between organization’s events to the relationships between competitors’ events. However, CCIA is restricted to the use of patent data as representative for competitors’ events and it applies a knowledge structure based text mining approach that does not allow considering semantic aspects from highly unstructured textual information. In contrast to related work, we propose an internet based environmental scanning procedure to identify textual patterns represent competitors’ events. To enable processing of this highly unstructured textual information, the proposed methodology uses latent semantic indexing (LSI) to calculate the compared cross impacts (CCI) for an organization. A latent semantic subspace is built that consists of semantic textual patterns. These patterns are selected that represent organization’s events. A web mining approach is used for crawling textual information from the internet based on keywords extracted from each selected pattern. This textual information is projected into the same latent semantic subspace. Based on the relationships between the semantic textual patterns in the subspace, CCI is calculated for different events of an organization. A case study shows that the proposed approach successfully calculates the CCI for technologies processed by a governmental organization. This enables decision makers to direct their investments more targeted. 相似文献
18.
事件关系检测是一项面向事件之间逻辑关系的自然语言处理技术。事件关系识别的核心任务是以事件为基本语义单元,通过分析事件的篇章结构信息及语义特征,实现事件逻辑关系的深层检测。该文首次建立一套事件关系检测的任务和研究体系,包括任务定义、关系体系划分、语料采集与标注、评价方法等。同时,该文提出了一种跨场景推理的事件关系检测方法,该方法认为,具有相同事件场景的“事件对”,往往具有相同的事件关系类型。该文提出的基于跨场景推理的事件关系检测方法在针对四大类事件关系类型的检测精确率为54.21%。 相似文献
19.
ProSPer:一个支持proactive特性的通用型事件监控系统 总被引:1,自引:0,他引:1
大规模网络安全监控应用中需要对网络安全态势进行动态评估,在网络出现重大安全风险前进行proac-tive特性的有效防范.把网络安全监控系统建模为事件监控系统,对满足复合时序和属性值逻辑关系的多个事件进行关联,把多个原子事件复合为语义更丰富、更抽象的复合安全事件.已有研究提出了不同的复合事件检测模型,但缺乏proactive的事件监控能力.基于时序关系并不能提高事件监控的预测能力的假设.设计了基于top-k复合事件检测模型的事件监控系统ProSPer,为网络安全监控等应用系统提供proactive特性的事件监控能力.与已有的复合事件检测系统相比,ProSPer检测复合事件时无需读取全部成分事件,这种proactive特性是非常有意义的设计. 相似文献
20.
Semantic analysis of soccer video using dynamic Bayesian network 总被引:3,自引:0,他引:3
Video semantic analysis is formulated based on the low-level image features and the high-level knowledge which is encoded in abstract, nongeometric representations. This paper introduces a semantic analysis system based on Bayesian network (BN) and dynamic Bayesian network (DBN). It is validated in the particular domain of soccer game videos. Based on BN/DBN, it can identify the special events in soccer games such as goal event, corner kick event, penalty kick event, and card event. The video analyzer extracts the low-level evidences, whereas the semantic analyzer uses BN/DBN to interpret the high-level semantics. Different from previous shot-based semantic analysis approaches, the proposed semantic analysis is frame-based for each input frame, it provides the current semantics of the event nodes as well as the hidden nodes. Another contribution is that the BN and DBN are automatically generated by the training process instead of determined by ad hoc. The last contribution is that we introduce a so-called temporal intervening network to improve the accuracy of the semantics output. 相似文献