排序方式: 共有37条查询结果,搜索用时 343 毫秒
1.
组合原则表明句子的语义由其构成成分的语义按照一定规则组合而成,由此基于句法结构的语义组合计算一直是一个重要的探索方向,其中采用树结构的组合计算方法最具有代表性。但是该方法难以应用于大规模数据处理,主要问题是其语义组合的顺序依赖于具体树的结构,无法实现并行处理。该文提出一种基于图的依存句法分析和语义组合计算的联合框架,并借助复述识别任务训练语义组合模型和句法分析模型。一方面,图模型可以在训练和预测阶段采用并行处理,极大地缩短计算时间;另一方面,联合句法分析的语义组合框架不必依赖外部句法分析器,同时两个任务的联合学习可使语义表示同时学习句法结构和语义的上下文信息。我们在公开汉语复述识别数据集LCQMC上进行评测,实验结果显示准确率接近树结构组合方法,达到79.54%,预测速度最高可提升30倍以上。 相似文献
2.
Yang Chin Lung; Perfetti Charles A.; Schmalhofer Franz 《Canadian Metallurgical Quarterly》2007,33(1):55
An event-related potentials (ERPs) study examined word-to-text integration processes across sentence boundaries. In a two-sentence passage, the accessibility of a referent for the first content word of the second sentence (the target word) was varied by the wording of the first sentence in one of the following ways: lexically (explicitly using a form of the target word); conceptually (using a paraphrase of the target word), and situationally (encouraging an inference concerning the referent of the target word). A baseline condition had no coreference between the two sentences. ERP results on the target word indicated multiple effects related to word identification and word-to-referent mapping processes. Both the explicit and paraphrase conditions, but not the inference condition, showed a reduced N400 relative to the baseline condition, consistent with immediate integration by lexico-semantic processes. A 300-ms effect (P300) was found in the paraphrase condition. The results were consistent with an immediate integration hypothesis and furthermore differentiated a lexical (N200), a conceptual (P300), and a situational (N400) component for this integration. The conceptual basis appears not to extend to predictive inferences. (PsycINFO Database Record (c) 2010 APA, all rights reserved) 相似文献
3.
钱正福 《苏州大学学报(工科版)》2001,21(4):82-85
本文论述了文化补偿的四种方法.由于原语和目的语文化之间存在的差异性和不对应性,译者应在忠实于原文的基础上,采用必要的补偿手段,以充分传达原文信息,在原语和译语之间取得最大限度的等值. 相似文献
4.
释义识别技术(Paraphrase Identification, PI)被广泛用于问答系统、抄袭检测、个性化推荐等领域.针对已有释义识别方法缺乏有效的特征提取机制问题,提出了一种新的释义识别模型.与传统“编码-匹配”模式不同,采用“编码-匹配-提取”模式,通过添加特征提取层进一步提取分类信息.所提出模型由6层组成:输入层、嵌入层、编码层、匹配层、特征提取层、输出层.在编码层,采用基于注意力机制的上下文双向长短期记忆网络对文本上下文进行编码,充分利用句子的前向和逆向两个方向的上下文信息;在匹配层,通过多种矩阵运算,从不同角度获得句子对匹配信息;在特征提取层,利用Xception网络以便更有效地从匹配结果中提取分类信息.此外,本文采用多特征融合的方法,将GloVe预训练的词向量、字符向量和附加特征向量的连接作为最终的词向量,较普通的词向量携带更丰富的语义信息.实验结果表明,所构建的模型在Quora和SemEval-2015 PIT两个公开数据集上(分别作为大型数据集和中小型数据集的代表)都达到了竞争性效果. 相似文献
5.
问句复述识别旨在识别两个自然问句是否语义一致。目前,基于表示学习和深度神经网络架构的复述识别技术已取得较好效果。但是,这类方法往往面临复杂度较高且训练难度较大的瓶颈。针对这一问题,该文提出一种快速的多卷积自交互匹配方法。该方法融合了多种句子特征和词义特征,并由此形成分布式表示。在此基础上,这一方法利用卷积神经网络获取短语级的句子向量表示,并利用自交互融合技术将词级与短语级的向量表示进行充分融合,借以获得多粒度句子向量表示。该文将这一方法应用于判定自然语句是否互为复述的二元分类任务中,利用Quora标准问句复述识别语料进行测试。实验结果证明,在不引入外部数据的情况下,该文所提方法与基于双向多视角匹配的基准模型具有可比的性能,但在空间复杂度上具有较高的优越性,并且获得更快训练速度。具体地,该方法训练所需的物理显存比基准模型方法下降80%,训练迭代速度快19倍。 相似文献
6.
陆国才 《沙洲职业工学院学报》2008,11(1)
对情态动词的次要用法——推测性表示法进行讨论。分析了推测性表示法的不同用法,对语义上表示肯定、不可能、不肯定和可能的推测性情态表示法及实现这些表达式的具体情态动词有一个总的理解。同时,还讨论了推测性情态动词与非推测性情态动词在用法上的差异。 相似文献
7.
该文将汉语母语者的160份复述文本与其原文进行以小句为单位的逐句比对,发现其中出现了6 484对复述句对。从其生成的方式来看,可以分为改换词语和重铸整句两大类。以语用学原理对这些复述句进行分析,发现与以往研究的复述现象不同的是: 句对间往往不具有相同的逻辑语义真值,但在特定语境下却能传达同一个语用意义,具有等效的语用功能。这说明在自然语言处理中,识别进入真实交际中的复述句不仅依赖语法、语义知识库,还需要借助含有语用知识和语境信息的知识库。 相似文献
8.
9.
短语复述自动抽取是自然语言处理领域的重要研究课题之一,已广泛应用于信息检索、问答系统、文档分类等任务中。而专利语料作为人类知识和技术的载体,内容丰富,实现基于中英平行专利语料的短语复述自动抽取对于技术主题相关的自然语言处理任务的效果提升具有积极意义。该文利用基于统计机器翻译的短语复述抽取技术从中英平行专利语料中抽取短语复述,并利用基于组块分析的技术过滤短语复述抽取结果。而且,为了处理对齐错误和翻译歧义引起的短语复述抽取错误,我们利用分布相似度对短语复述抽取结果进行重排序。实验表明,基于统计机器翻译的短语复述抽取在中英文上准确率分别为43.20%和43.60%,而经过基于组块分析的过滤技术后准确率分别提升至75.50%和52.40%。同时,利用分布相似度的重排序算法也能够有效改进抽取效果。 相似文献
10.