首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 109 毫秒
1.
针对专利文本翻译中长句翻译的问题,提出了一种句子切分算法,即把长句切分成多个独立的小句后再进行翻译的方法。切分算法使用了概念层次网络(HNC)理论的语义特征来切分小句,切分算法和一个基于规则的基线翻译系统进行了融合,融合后的翻译系统的BLEU值达到0189 8,比融合前的系统提高了30%。实验结果证明,提出的方法可以有效地改进专利翻译效果。  相似文献   

2.
近年来,深度学习取得了重大突破,融合深度学习技术的神经机器翻译逐渐取代统计机器翻译,成为学术界主流的机器翻译方法。然而,传统的神经机器翻译将源端句子看作一个词序列,没有考虑句子的隐含语义信息,使得翻译结果与源端语义不一致。为了解决这个问题,一些语言学知识如句法、语义等被相继应用于神经机器翻译,并取得了不错的实验效果。语义角色也可用于表达句子语义信息,在神经机器翻译中具有一定的应用价值。文中提出了两种融合句子语义角色信息的神经机器翻译编码模型,一方面,在句子词序列中添加语义角色标签,标记每段词序列在句子中担当的语义角色,语义角色标签与源端词汇共同构成句子词序列;另一方面,通过构建源端句子的语义角色树,获取每个词在该语义角色树中的位置信息,将其作为特征向量与词向量进行拼接,构成含语义角色信息的词向量。在大规模中-英翻译任务上的实验结果表明,相较基准系统,文中提出的两种方法分别在所有测试集上平均提高了0.9和0.72个BLEU点,在其他评测指标如TER(Translation Edit Rate)和RIBES(Rank-based Intuitive Bilingual Evaluation Score)上也有不同程度的性能提升。进一步的实验分析显示,相较基准系统,文中提出的融合语义角色的神经机器翻译编码模型具有更佳的长句翻译效果和翻译充分性。  相似文献   

3.
口语理解在口语自动翻译和人机对话系统中具有非常重要的作用。本文面向口语自动翻译提出了一种统计和规则相结合的汉语口语理解方法,该方法利用统计方法从训练语料中自动获取语义规则,生成语义分类树,然后利用语义分类树对待解析的汉语句子中与句子浅层语义密切相关的词语进行解析,最后再利用统计理解模型对各个词语的解析结果进行组合,从而获得整个句子的浅层语义领域行为。实验结果表明,该方法具有较高的准确率和鲁棒性,适合应用在限定领域的汉语口语浅层语义理解。  相似文献   

4.
陈遥  朱跃龙  冯钧 《计算机工程》2008,34(11):200-202
介绍针对信息提取的机器翻译模型,分析该模型下基于语法分析的水情电报翻译系统及存在的问题。采用机器翻译中语义分析技术解决问题,利用语义信息提高翻译率。用逻辑语义建立水情电报的逻辑语义模型,结合语义信息实现对几种类型错报的翻译,由此提出基于语义的水情电报翻译模型。对系统的评价与分析结果表明,翻译率即自动化程度得到了提高,报文的不可翻译率从2%~5%降到0.96%左右。  相似文献   

5.
序列到序列(seq2seq)的框架可以应用到抽象语义表示(AMR)解析任务中,把AMR解析当作一个从源端句子到目标端AMR图的翻译任务。然而,以前的工作通常把源端句子表示为一个单词序列,忽略了句子内部潜藏的句法和语义角色信息。基于seq2seq框架,该文提出了一个直接而有效的融合句法和语义角色信息的AMR解析方法。实验结果表明,该文的方法在AMR英文标准数据集上取得了6.7%的显著提升。最后,该文从多个角度深入分析了源端的句法和语义角色信息是如何对AMR解析提供帮助的。分析表明,词性信息和subword技术对AMR解析性能提升的贡献最大,上层句法和语义角色信息次之。  相似文献   

6.
自然语言合理句子的生成系统   总被引:1,自引:0,他引:1  
基于语法规则的使用Chomsky上下文无关文法产生的句子虽合乎语法规则但并不一定合乎语义常理.文中提出一种可以产生合理的自然语言句子的产生系统{TI,N,BI,CI,S,FI,PI},其中,I是指定的自然语言.该系统建立在语义语言理论上,使用Chomsky短语文法.系统的关键技术是引入了语义单元技术、类型参量,类型参量的作用不仅体现在语义单元中而且还体现在句树、事物树和函数集中.语义单元和类型参量共同作用能有效的对产生的句子进行语义约束使得生成的句子合理.  相似文献   

7.
任燕  洪忻 《中文信息学报》2006,20(Z1):36-40
本文总结了译星翻译系统所采用的技术方法,以及译星系统针对一般篇章翻译所采取的一些策略.在技术方法中,介绍了译星系统的语言模型、结构设计、源文分析与译文生成思想.对于翻译策略,提出了基于词组的语言单元分析方法,以及语义结构优先语法结构的处理原则,从而加强了词组和语义在机器翻译中的地位与作用.同时还介绍了如何加强语义分析的具体实施方法.以这些翻译策略为改进原则,译星翻译系统的翻译质量得到了提高.其中,译星汉英系统的篇章翻译忠实度达到了54%,译星英汉系统篇章翻译达到了51%.  相似文献   

8.
在机器翻译的方法中,基于规则的翻译方法和基于实例的翻译方法都有各自的优缺点。结合两者的优点,提出了一种基于弱化语法规则的机器翻译方法,该方法在大量分析句子语法特征的基础上以及利用语言专家的知识构建语法规则库,在利用语法识别出句子后,把句子的各个组成部分标记出来,然后利用语义块进行匹配推理翻译出句子的各个组成部分。最后根据句法把句子的各个译出的组成部分装配起来形成译文。实验表明,该方法达到了较好的翻译效果,并且具有较大的发展潜力。  相似文献   

9.
以依存结构树和"格语法"思想为基础,设计了针对符合语法语义规则的复杂句子汉英翻译软件,尤其是广大以规范的句子语法和常用的惯用语作为依据和素材的复杂汉语句子,着重介绍了句子主干+状语模块的翻译策略,以及其他复杂修饰结构的分析和处理,并以状语结构和各种不同的名词结构为详细例证,按照汉语的语法和语义分析了短语的结构以及词性的转化。文章的最后提出了规则库中的翻译模型的算法架构,给出了软件的实现方法,以及实用性测试结果。  相似文献   

10.
句子语义分析是语言研究深入发展的客观要求,也是当前制约语言信息处理技术深度应用的主要因素。在探索深层语义分析方法的基础上,该文根据汉语的特点,提出了一整套语义依存图的构建方法,并建立了一个包含30 000个句子的语义依存图库。以兼语句为重点研究对象,该文研究了语料库中所有纯粹的兼语句所对应的句模情况,进而试图构建基于语义依存图的句模系统,总结句型和句模的映射规则,从而为更好的建立语义自动分析模型提供相应的知识库。
  相似文献   

11.
为了改善专利文献的机器翻译效果, 提出了一种基于模板的机器翻译方法。通过分析汉英双语对齐的专利文献语料, 人工书写了600余条模板, 模板的设计思想源于弱化的正则文法; 设计和实现了一个模板翻译模块, 并将其与已有的一个基于规则的机器翻译系统相融合。实验结果表明, 40%以上的测试文本的翻译质量得到了提高, 因此, 这种基于模板的方法对于改善专利文献的机器翻译效果是有效的。  相似文献   

12.
兼类词在汉语专利语料中分布普遍。面向汉英专利机器翻译提出了一种基于规则的动-介兼类词识别方法。根据边界感知原则和兼类词的句法语义属性以及周围的语境信息,设计了一系列兼类排歧规则,同时分别提出了兼类词识别为动词或介词的策略,并以形式化的规则加以描述。相关实验测试表明提出的方法可以有效地识别动-介兼类词语,对改善翻译系统的翻译结果也有帮助。  相似文献   

13.
An approach for managing knowledge in an organization in the new infrastructure of Semantic Web consists of building a corporate semantic web (CSW). The main components of a CSW are (i) evolving resources distributed over an intranet and indexed using (ii) semantic annotations expressed with the vocabulary provided by (iii) a shared ontology. However, changes in the operating environment may lead to some inconsistencies in the system and they result in need of modifications of the CSW components. These changes need to be evolved and well managed. In this paper we present a rule-based approach allowing us to detect and correct semantic annotation inconsistencies. This rule-based approach is implemented in the CoSWEM system enabling to manage the evolution of such a CSW, especially to address the evolution of semantic annotations when its underlying ontologies change.  相似文献   

14.
Aspect category detection (ACD) is an important subtask of aspect-based sentiment analysis (ABSA). It is a challenging problem due to subjectivity involved in categorization, as well as the existence of overlapping classes. Among various approaches that have been applied to ACD include rule-based approaches along with other machine learning approaches, and most of them are statistical in nature. In this article, we have used an association rule-based approach. To deal with the statistical limitation of association rules, we proposed a hybridized rule-based approach that combines association rules with the semantic association. For semantic associations, we have used the notion of word-embeddings. Experiments were performed on SemEval dataset, a standard benchmark dataset for aspect categorization in the restaurant domain. We observed that semantic associations can complement statistical association and improve the accuracy of classification. The proposed method performs better than several state-of-the-art methods.  相似文献   

15.
针对大规模专利图像特征库的特点,使用边缘轮廓距离与分块特征相结合的方法提取低层视觉特征,结合基于K均值聚类的分类索引方法,兼顾语义相似和视觉特征相似,对专利图像库数据构建索引结构,实现了先分类后检索的功能。实验结果表明,方法不仅提高了检索速度,而且提高了检索的语义敏感度。  相似文献   

16.
多策略汉日机器翻译系统中的核心技术研究   总被引:1,自引:0,他引:1  
多策略的机器翻译是当今机器翻译系统的一个发展方向。该文论述了一个多策略的汉日机器翻译系统中各翻译核心子系统所使用的核心技术和算法,其中包含了使用词法分析、句法分析和语义角色标注的汉语分析子系统、利用双重索引技术的基于翻译记忆技术的机器翻译子系统、以句法树片段为模板的基于实例模式的机器翻译子系统以及综合了配价模式和断段分析的机器翻译子系统。翻译记忆子系统的测试结果表明其具有高效的特性;实例模式子系统在1 559个句子的封闭测试中达到99%的准确率,在1 500个句子的开放测试中达到85%的准确率;配价模式子系统在3 059个句子的测试中达到了89%的准确率。  相似文献   

17.
本文提出了一种基于循环神经网络的语义完整性分析方法,通过判断句子是否语义完整,将长文本切分成多个语义完整句.首先,对文本进行分词,映射为相应的词向量并进行标注,然后将词向量和标注信息通过循环窗口和欠采样方法处理后,作为循环神经网络的输入,经过训练最后得到模型.实验结果表明,该方法可以达到91.61%的准确率,为主观题自动评分工作提供了基础,同时对语义分析、问答系统和机器翻译等研究有一定的帮助.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号