首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
索引模板匹配替换通用算法能够自动快速地从模板对应规则库找到与英语句子中相匹配的英语模板,并将其替换成相对应的汉语模板。以该算法为基础的英汉翻译系统能够合理地综合基于规则和基于例子的翻译系统的优点,同时能够在一定程度上克服它们的缺点。速度测试表明,该该英汉翻译系统在P—IV1.7G的计算机上的翻译速度每秒可以达到1300个单词左右;质量测试表明,该系统具有较好的发展潜力。  相似文献   

2.
基于通用模板匹配替换方法的英汉翻译系统   总被引:4,自引:1,他引:4  
在常项、变项、模板和实例等概念的基础上,提出了一种用模板匹配替换策略实现机器翻译系统的新方法,并通过若干翻译实例说明了该方法在用于实现英汉翻译系统的工作过程和潜在优势。引入适当的启发式索引机制后,以该方法为基础实现的英汉翻译系统翻译速度每秒可以达到500-600个单词。通过对470个有代表性的英语句子进行翻译测试表明,该系统的翻译正确率达到了93.6%,超过了目前市场上流行的英汉翻译系统。  相似文献   

3.
模板匹配算法是字符识别中最常用的一种算法。本文首先介绍了字符识别与模板匹配算法的基本原理,然后在传统模板匹配方法的基础上提出了两种改进的模板匹配算法。一是多模板匹配法,该算法可以对模糊不清、有倾斜的字符进行了有效识别;二是字符区域分割匹配法,该算法使相似度较大的字符可以得到准确的识别,并且大大减少了计算量,加快了识别速度。本文使基于模板匹配的字符识别达到了更有效,更准确的效果。  相似文献   

4.
近几年来,基于短语的统计翻译模型在机器翻译研究中受到普遍关注,并取得了较好的翻译性能。但是,由于目前基于短语的翻译系统在解码时采用精确匹配的策略,常常导致数据稀疏,一方面,有些短语在训练获得的短语表中找不到精确的匹配,使其成为未知短语;另一方面,短语表中大量的短语无法得到充分的利用。为此,我们提出了基于短语模糊匹配和句子扩展的翻译方法。对于不存在于短语表中的短语,通过模糊匹配的办法,寻找与其相似的短语,然后将所有相似短语用于替换原短语,从而生成扩展句子,在此基础上对所有扩展的句子进行翻译。由于并不是所有扩展后的句子都能提高原始句子的翻译效果,因此,我们在句子翻译完成后设置了组合分类器用于选择最优翻译结果。实验证明,这种方法可以有效地提高翻译系统的译文质量。  相似文献   

5.
多策略机器翻译系统IHSMTS中实例模式泛化匹配算法   总被引:1,自引:1,他引:1  
基于精确匹配的EBMT,由于翻译覆盖率过低,导致其难以大规模实际应用。本文提出一种实例模式泛化匹配算法,试图改善EBMT的翻译覆盖率:以输入的待翻译句子为目标导向,对候选翻译实例有针对性地进行实时泛化,使得算法既能满足实时文档翻译对速度的要求,又能充分利用系统使用过程中用户新添加和修改的翻译知识,从而总体上提高了系统的翻译覆盖率和翻译质量。实验结果表明,在语料规模为16 万句对的情况下,系统翻译覆盖率达到了75 %左右,充分说明了本文算法的有效性。  相似文献   

6.
提出一种用模板匹配来检测CT增强扫描中的小肝癌的算法,该算法先利用改进的区域生长方法提取出完整的肝部以减少模板匹配的计算量,然后简化YLee等人的模板匹配方法,从而达到加快计算速度的目的。  相似文献   

7.
提出一种用模板匹配来检测CT增强扫描中的小肝癌的算法,该算法先利用改进的区域生长方法提取出完整的肝部以减少模板匹配的计算量,然后简化Y Lee等人的模板匹配方法,从而达到加快计算速度的目的。  相似文献   

8.
一种新的指纹匹配方法   总被引:11,自引:0,他引:11       下载免费PDF全文
针对基于点模式匹配的指纹匹配算法速度较慢的现状,设计了一种新的指纹匹配方法,即利用纹线匹配技术来寻找基准点对的指纹匹配算法.该算法首先基于指纹纹线的相似程度寻找一对基准特征点;然后根据基准点对的坐标,计算两幅指纹图象(模板图象、待识图象)的相对平移和旋转参数,并将待识图象相对于模板图象进行图象姿势纠正;最后使用坐标匹配的方法统计两幅图象能够匹配的特征点数目.以实现两枚指纹的匹配.实验证明.该算法匹配速度很快,误识率低,准确性高,并具有图象旋转平移不变性.对面积适中的指纹图象,匹配结果可以满足在线应用的需要.该算法有望发展成为一种实用、有效的指纹匹配技术.  相似文献   

9.
在机器翻译的方法中,基于规则的翻译方法和基于实例的翻译方法都有各自的优缺点。结合两者的优点,提出了一种基于弱化语法规则的机器翻译方法,该方法在大量分析句子语法特征的基础上以及利用语言专家的知识构建语法规则库,在利用语法识别出句子后,把句子的各个组成部分标记出来,然后利用语义块进行匹配推理翻译出句子的各个组成部分。最后根据句法把句子的各个译出的组成部分装配起来形成译文。实验表明,该方法达到了较好的翻译效果,并且具有较大的发展潜力。  相似文献   

10.
提出了一种改进的模板匹配的数字识别算法,该算法是预先将字符分成若干个集合,经细化得到数字中央的骨骼部分,再对待识别数字提取特征并与训练库中的数字特征加权比较,利用欧式距离最小原则来对数字作出判决,试验结果表明,加权的模板匹配法保证了数字识别的正确率,而对数字进行预分类和细化处理,可以大大缩小模板匹配的识别速度,弥补了模板匹配算法对于大量数字耗时多的缺点,提升了系统速度。  相似文献   

11.
序列到序列(seq2seq)的框架可以应用到抽象语义表示(AMR)解析任务中,把AMR解析当作一个从源端句子到目标端AMR图的翻译任务。然而,以前的工作通常把源端句子表示为一个单词序列,忽略了句子内部潜藏的句法和语义角色信息。基于seq2seq框架,该文提出了一个直接而有效的融合句法和语义角色信息的AMR解析方法。实验结果表明,该文的方法在AMR英文标准数据集上取得了6.7%的显著提升。最后,该文从多个角度深入分析了源端的句法和语义角色信息是如何对AMR解析提供帮助的。分析表明,词性信息和subword技术对AMR解析性能提升的贡献最大,上层句法和语义角色信息次之。  相似文献   

12.
一种基于优先关系的LSD分析算法   总被引:1,自引:0,他引:1  
句法分析是机器翻译中的一个重要环节,首先介绍了基于LSD方法进行句法分析的基金概念,然后提出了一种苦于优先关系的确定性LSD算法,主要讨论了基于名法结构信息优先关系和基于词谍统计优先关系的句法结构歧义消解策略,并给出了具体实现方法和复杂性分析,实验结果表明,该方法在保持确定性算法分析效率的前提下,提高了分析结果的正确率和规则应用的召回率。  相似文献   

13.
工业中实时监控系统的实时异构集成数据在解析存储时需要适应用户需求多样性和可变性的特点,因此集成数据的解析成为一个难点。以环境在线监控系统为应用背景,提出了针对实时异构集成数据的自适应模板数据解析思想。数据解析前,根据集成数据,以用户需求为基础设计的用户表以及定义的模板构建规则,构造描述集成数据与用户表映射关系的自适应模板。解析算法根据模板对集成数据进行解析分类。该算法只根据模板的描述对数据进行解释,具有良好的通用性以及可拓展性。通过实际数据进行测试,结果表明提出的自适应模板解析算法具有良好的性能,能够很好地适应用户需求多样性和可变性的特点。  相似文献   

14.
In this paper, we propose a new approach for automatically acquiring translation templates from unannotated bilingual spoken language corpora. Two basic algorithms are adopted: a grammar induction algorithm, and an alignment algorithm using bracketing transduction grammar. The approach is unsupervised, statistical, and data-driven, and employs no parsing procedure. The acquisition procedure consists of two steps. First, semantic groups and phrase structure groups are extracted from both the source language and the target language. Second, an alignment algorithm based on bracketing transduction grammar aligns the phrase structure groups. The aligned phrase structure groups are post-processed, yielding translation templates. Preliminary experimental results show that the algorithm is effective.  相似文献   

15.
基于DOP的汉语句法分析技术   总被引:2,自引:1,他引:2  
本文提出一种以DOP技术作为基本框架,同时利用基于相似的概率评估技术,实现汉语句法分析的方法。其中,对于输入语句,首先需要经过词汇层与词性层两层初选。然后,基于已构建知识源,获取输入语句的片段组合形式。最后,对输入语句与初选结果进行相似性评估,完成输入语句的组合分析过程。为论证方法有效性,基于包含1000个语句的真实汉语语料构建知识源,并采用包含100个语句的真实汉语语料作为测试集。实验表明,句法分析的各项指标都比较令人满意,可有效地实现汉语句法分析。  相似文献   

16.
一种有效的概率上下文无关文法分析算法*   总被引:3,自引:1,他引:3  
朱胜火  周明  刘昕  黄昌宁 《软件学报》1998,9(8):592-597
句法分析的研究是自然语言处理领域的一个重要组成部分。该提出并实现了一种有效的概率上下无关法SCFG(stochastic context-free grammer)的分析算法。首先对原有的GLR分析有加以改造,以便能够利用分析过程的控制结构来计算有关的概率;然后对分析过程中的每个状态增设了下标,以区分不同的归约路径。通过上述手段,成功地引入了状态的前向(Forward)概率和内(Inner)  相似文献   

17.
本文以面向数据分析为基本思想,同时结合相似度概率评估技术,实现中文问句句法分析。对于输入问句,首先需要经过词汇层与词性层以及句型和疑问词初选得到片段;然后,基于已构建的数据库,对词汇词性序列的子序列搜索片段,进行片段组合;最后,对输入语句与初选结果进行相似性评估,完成输入语句的组合分析过程。为论证方法有效性,基于200句山西旅游问句做实验。实验结果表明,句法分析的准确率达到96%。  相似文献   

18.
现有单一策略的机器翻译系统很难有效地解决机器翻译所面临的所有问题。本文,提出一种基于人机交互互动的多策略机器翻译系统设计方法,该方法把基于多知识一体化描述的规则推理、基于经验记忆的类比启发式搜索推理和基于统计知识的概率方法及适当程度的人机交互有机地结合起来,利用现有基于规则的智能机器翻译系统自动产生具有各种特征知识的特征事例模式库,从而既可以通过与以往翻译实例的类比启发式搜索有效地利用以往系统成功的句子分析经验解决相似句子的分析,同时对特征事例模式库中没有相似实例的句子,又可以利用原有基于规则的方法和统计概率方法进行翻译转换处理,并在系统本身的知识不足以解决所遇到的多义区分问题时适时由人介入,从而可以大提高系统的翻译速度和翻译准确率,增强系统的实用性。  相似文献   

19.
结合结构下文及词汇信息的汉语句法分析方法   总被引:2,自引:0,他引:2  
针对句法分析中上下文无关语法模型对句子信息利用的不足,通过融入结构下文和部分词汇信息,提出两种基于概率上下文无关语法模型的短语结构消歧方法,以达到消解结构歧义的目的;引入分层分析的算法,通过损失一定的时间效率使得在提高分析准确率的同时保证分析结果的全面性。实验结果表明,融入结构下文及词汇信息的汉语句法分析方法,利用了更多的句子信息,与上下文无关语法相比有着更强的消歧能力。  相似文献   

20.
Although many linguistic theories and formalisms have been developed and discussed on the problem of parsing algorithm in the past decades,the efficiency and accuracy of parsing are still serious problems in practical machine translation systems.This paper presents a parsing algorithm wit dynamic rule selection and the experimental results.By describing the design and practice of the inproved algorithm ,the paper discusses in detail the designing method for a high speed and efficient parser.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号