首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
机器翻译中数字和数词相关表达形式的词法分析技术   总被引:1,自引:0,他引:1  
为了解决机器翻译中有关数字和数词的语言表达形式的词法分析问题,通过分析相关语料,总结出此类语言形式的一般性特点,提出了基于动态模板匹配和知识库的处理策略,并介绍了实现其词法分析过程的步骤和方法。  相似文献   

2.
一种基于静态词法树的程序相似性检测方法*   总被引:1,自引:0,他引:1  
传统的程序相似性检测工具并不能有效地检测出一些常见的高级词法、语义理解变换的抄袭方式。首先归纳了学生常用的三类抄袭手段,然后给出了基于词法树的程序相似性检测方法。以C语言为例,总结了生成词法树的结构体,并对程序的词法树进行主数据流、结构控制流和时序流分析后得出结构体依赖图;使用形式化的图同型方法来判断代码是否相似,还给出了一个聚类方法以获得彼此相似的程序子集。通过与JPlag、BuaaSim系统针对一组典型的抄袭样本集进行评测结果对比,本方法具有更好的检测效果。  相似文献   

3.
袁琼 《福建电脑》2012,28(4):159-160,165
通过实际构造Simple C语言,并在该语言的基础上完成了词法分析器中翻译表和状态转换图的设计,达到了将词法分析器的构造原理运用于实践的目的。  相似文献   

4.
本文提出了一种新型的模糊推理语言FUZZYLOG,介绍了该语言使用的网络式模糊知识库结构,并重点叙述了基于这种结构的网络式推理机的设计思想和实现算法,以及为提高效率和推理精度而设计的“最大子式匹配算法”。  相似文献   

5.
基于规则知识的英语词法分析研究   总被引:2,自引:0,他引:2  
词法分析是自然语言处理系统首要的词汇级语言分析模块。以MatLink英汉机器翻译系统为基础,介绍了词法分析所要求的语言知识及其组织结构,并给出了处理这些语言知识的算法。该词法分析器结构模型不仅具有自学习功能,而且最大限度地从语义角度进行词汇级词语组合。实验表明,它可以降低句法分析的复杂性,提高语言分析的正确率与分析效率。  相似文献   

6.
基于知识库的智能策略翻译技术   总被引:3,自引:0,他引:3       下载免费PDF全文
提出基于知识库的策略翻译方法,设计策略翻译组成结构,分析策略知识及其表示形式,建立动态可扩展的策略知识库,开发可扩展的策略编译器和策略组装器。实例测试表明,该技术实现了策略翻译的智能化,解决了各种设备的策略不能统一管理的问题。  相似文献   

7.
策略翻译是实现策略管理的关键问题之一.设计了一种可扩展的策略翻译系统结构,提出了两阶段转换的思想,阶段1采用编译原理的思想,设计策略编译器,通过词法和语法分析,将源策略首先转换为与设备无关的中间策略,阶段2采用人工智能的思想,设计策略组装器,通过策略知识库,将中间策略转换为目标设备可执行的策略.并且通过设计词法库和策略知识库,实现了可扩展的策略翻译,增强了策略翻译的灵活性和可操作性.  相似文献   

8.
为实现基于TTCN-3的协议一致性测试系统,提出一种通过编译方式将TTCN-3语言转换为C++语言的编译器方案。通过对TTCN-3核心语言的研究分析,运用正则语言解析方法实现词法分析模块;在词法分析输出基础上编写上下文无关文法规则,使用多种方法较为彻底地解决语法冲突问题,实现语法分析模块;实现将TTCN-3语言转换为C++语言的编译器前端模块。该方案可快速实现对TTCN-3源代码的词法分析和语法分析,输出单词符号序列并检查其是否符合预定义的语法规则,对错误进行定位、报错并输出编译结果。  相似文献   

9.
董兴华  徐春  王磊  周喜 《计算机工程与应用》2012,48(15):144-148,200
描述了通过使用外部知识库和基于短语的翻译模型,利用多线程、任务分发的技术实现了一个在线的、高性能的多语言翻译引擎,已初步实现了维汉、哈汉、柯汉三种语言间的翻译。翻译引擎很容易扩展到其他语言对,具有翻译词、短语、句子、文件和网页的功能。  相似文献   

10.
采用Prolog智能语言对装备维修决策专家系统进行了设计与开发。从维修知识和推理能力两方面研究了装备维修专家的基本特点;分析了基于Prolog的专家系统的基本语法、推理方式及其在装备维修中的应用方式;设计并开发了装备维修决策专家系统的元知识库、关联知识库和应用知识库;最后采用Visual Prolog和VC++混合编程方式开发了某装备维修决策专家系统。  相似文献   

11.
龚龙超  郭军军  余正涛 《计算机应用》2022,42(11):3386-3394
当前性能最优的机器翻译模型之一Transformer基于标准的端到端结构,仅依赖于平行句对,默认模型能够自动学习语料中的知识;但这种建模方式缺乏显式的引导,不能有效挖掘深层语言知识,特别是在语料规模和质量受限的低资源环境下,句子解码缺乏先验约束,从而造成译文质量下降。为了缓解上述问题,提出了基于源语言句法增强解码的神经机器翻译(SSED)方法,显式地引入源语句句法信息指导解码。所提方法首先利用源语句句法信息构造句法感知的遮挡机制,引导编码自注意力生成一个额外的句法相关表征;然后将句法相关表征作为原句表征的补充,通过注意力机制融入解码,共同指导目标语言的生成,实现对模型的先验句法增强。在多个IWSLT及WMT标准机器翻译评测任务测试集上的实验结果显示,与Transformer基线模型相比,所提方法的BLEU值提高了0.84~3.41,达到了句法相关研究的最先进水平。句法信息与自注意力机制融合是有效的,利用源语言句法可指导神经机器翻译系统的解码过程,显著提高译文质量。  相似文献   

12.
基于分层语块分析的统计翻译研究   总被引:1,自引:0,他引:1  
本文描述了一个基于分层语块分析的统计翻译模型。该模型在形式上不仅符合同步上下文无关文法,而且融合了基于条件随机场的英文语块分析知识,因此基于分层语块分析的统计翻译模型做到了将句法翻译模型和短语翻译模型有效地结合。该系统的解码算法改进了线图分析的CKY算法,融入了线性的N-gram语言模型。目前,本文主要针对中文-英文的口语翻译进行了一系列实验,并以国际口语评测IWSLT(International Workshop on Spoken Language Translation)为标准,在2005年的评测测试集上,BLEU和NIST得分均比统计短语翻译系统有所提高。  相似文献   

13.
14.
在机器翻译的方法中,基于规则的翻译方法和基于实例的翻译方法都有各自的优缺点。结合两者的优点,提出了一种基于弱化语法规则的机器翻译方法,该方法在大量分析句子语法特征的基础上以及利用语言专家的知识构建语法规则库,在利用语法识别出句子后,把句子的各个组成部分标记出来,然后利用语义块进行匹配推理翻译出句子的各个组成部分。最后根据句法把句子的各个译出的组成部分装配起来形成译文。实验表明,该方法达到了较好的翻译效果,并且具有较大的发展潜力。  相似文献   

15.
提出在面向数据的英汉机译系统中,一种以面向数据的语言分析技术作为基本框架的目标语生成机制。该机制通过对源语语句的句法分析树进行线性化操作,生成目标语译文。其中包括从源语语句句法分析树的所有片段组合形式中选择一个适合生成操作的生成片段组合形式、对生成片段组合形式中的所有片段进行线性化操作以及对所有片段已经线性化的生成片段组合形式进行线性操作,从而获取最终的目标语译文。为论证方法有效性,基于包含1,000个语句的真实英语语料构建知识源,并采用包含100个语句的真实英语语料作为测试集。实验表明,目标语译文质量比较令人满意,可成功地实现英汉机译。  相似文献   

16.
知识图谱在人工智能领域有着广泛的应用,如信息检索、自然语言处理、推荐系统等。然而,知识图谱的开放性往往意味着它们是不完备的,具有自身的缺陷。鉴于此,需建立更完整的知识图谱,以提高知识图谱的实际利用率。利用链接预测通过已有关系来推测新的关系,从而实现大规模知识库的补全。通过比较基于翻译模型的知识图谱链接预测模型,从常用数据集与评价指标、翻译模型、采样方法等方面分析知识图谱链接预测模型的框架,并对基于知识图谱的链接预测模型进行了综述。  相似文献   

17.
The translation is generally assumed to distinguish it from the original language text in the same area. Therefore, say these constitute a unique multilingual translation, commonly referred to as translation; translation is also affected by the source language and exhibits different characteristics according to the source language. Therefore, claim that these variants constitute the same target language translated into additional "dialog." Using Machine Learning English and embedded technologies investigated the differences between the general characteristics of different translation sources and language translation. There is little research corpus between the complicated relationship between translation and the original text and translation itself for very different language types. May does not translate enough knowledge of the subject areas covered. There are many guidelines to help authors clearly express their ideas to promote translation; scientists and engineers find it difficult to apply the procedures required for a high degree of speech recognition. For financial reasons, non-essential text may be edited publication. In this case, as described in the article, the author can take some precautions to express terms of intelligibility. Machine Learning and embedded systems determine the importance of various features for data collection and the importance of its characteristics compared with previously reported studies in English. Also, the method allows us to add the grammatical function of translation studies rarely used. The results show that, even if only based on five features, the full translation can be reliably separated from the non-translated region.  相似文献   

18.
该文提出利用一个大型且精度高的神经机器翻译模型(教师模型)从单语数据中提取隐性双语知识,从而改进小型且精度低的神经机器翻译模型(学生模型)的翻译质量。该文首先提出了“伪双语数据”的教学方法,利用教师模型翻译单语数据获得的合成双语数据改进学生模型,然后提出了“负对数似然—知识蒸馏联合优化”教学方法,除了利用合成双语数据,还利用教师模型获得的目标语言词语概率分布作为知识,从而在知识蒸馏框架下提高学生模型的翻译质量。实验证明,在中英和德英翻译任务上,使用该方法训练的学生模型不仅在领域内测试集上显著超过了基线学生模型,而且在领域外测试集上的泛化性能也得到了提高。  相似文献   

19.
双语翻译对在跨语言信息检索、机器翻译等领域有着重要的用途,尤其是专有名词、新词、俚语和术语等的翻译是影响其系统性能的关键因素,但是这些翻译对很难从现有的词典中获得。该文针对维基百科的领域覆盖率和结构特征,提出了一种从维基百科中自动获取高质量中英文翻译对的模板挖掘方法,不但能有效地挖掘出常见的模板,而且能够发现人工不容易察觉的复杂模板。主要方法包括三步: 1)从语言工具栏中直接抽取翻译对,作为进一步挖掘的启发知识;2)在维基百科页面中采用PAT-Array结构挖掘中英翻译对模板;3)利用挖掘的模板在页面中自动挖掘其他中英文翻译对,并进行模板评估。实验结果表明,模板发现翻译对的正确率达90.4%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号