首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
回顾了语料库分类及可比语料库中翻译等价对抽取方法研究的历史。根据从可比语料库中提取翻译等价对所依据的基本假设:一个语言中一个词在对应到另外一种语言时其与周围词之间的共现搭配关系仍然被保持,采用双向等价对获取计算然后求交集、词加权因数TF(iw)*IDF(i)值计算、上下文词的词性信息利用的方法来提高翻译等价对提取正确率。描述了翻译等价对抽取实验步骤,并对实验结果进行了简要分析。实验结果表明上述方法可以有效提高翻译等价对计算结果的正确率。最后提出了需要进一研究的问题。  相似文献   

2.
针对为汉藏辅助翻译系统建立汉藏多词单元翻译词典这一任务,该文提出了CMWEPM模型。该模型首先依据关联度和结合度来确定汉语语料中多词单元的边界,然后根据词对齐信息分别抽取严格和约束多词单元等价对,从而形成汉藏多词单元等价对。CMWEPM模型根据不同长度和频次对多词单元进行分类,并为不同类型设定不同阈值,最终提高了汉藏多词单元等价对的召回率,从而能够间接地提高汉藏辅助翻译系统的翻译质量。  相似文献   

3.
有关命名实体的翻译等价对在多语言处理中有着非常重要的意义。在过去的几年里,双语字典查找,音译模型等方法先后被提出。另一种极具价值的方法是从平行语料库中自动抽取有关命名实体的翻译等价对,现有的方法要求预先对双语语料库的两种语言文本进行命名实体标注。提出了一种只要求对语料库中源语言进行命名实体标注,目标语言不需标注,然后利用训练得到的HMM词对齐结果来抽取有关命名实体翻译等价对的方法。在实验中,把中文作为源语言,英文作为目标语言。实验结果表明用该方法,即使在对齐模型只是部分准确的情况下,也得到了较高正确率的命名实体翻译等价对。  相似文献   

4.
翻译等价对在词典编纂、机器翻译和跨语言信息检索中有着广泛的应用。文章从双语句对的译文等价树中抽取翻译等价对。使用译文直译率、短语对齐概率和目标语-源语言短语长度差异等特征对自动获取的等价对进行评价。提出了一种基于多重线性回归模型的等价对评价方法,并结合N-Best策略对候选翻译等价对进行过滤。实验结果表明:在开放测试中,基于多重线性回归模型的等价对评价及过滤方法其性能要优于其它方法。  相似文献   

5.
提出一种改进的短语抽取算法,该算法首先考虑词对齐矩阵中一个汉语词对齐到多个维语词的情况(包括不连续),然后采用Och方法进行判断.如果满足条件则进行短语抽取.试验结果表明,改进后的短语抽取算法能够抽取出更多汉维短语对,提高短语翻译对抽取的效果.  相似文献   

6.
从双语语料中获取翻译模板   总被引:1,自引:0,他引:1       下载免费PDF全文
翻译模板自动获取是提高MT译文输出质量和领域适应能力的关键性因素。利用Tree-to-String方法抽取等价对,使用错误驱动的学习方法从中获取翻译模板并进行优化。将优化后的翻译模板用于一个基于转换的机器翻译系统中,同时使用“863”对话语料对其进行评测。实验结果表明:当使用自动获取并经优化的模板进行翻译时,开放测试语料的译文评测分数有一定程度的提高。  相似文献   

7.
命名实体的翻译等价对在跨语言信息处理中非常重要。传统抽取方法通常使用平行语料库或可比语料库,此类方法受到语料库资源的质量和规模的限制。在日汉翻译领域,一方面,双语资源相对匮乏;另一方面,对于汉字命名实体,通常使用汉字对照表;对于日语纯假名的命名实体,通常采用统计翻译模型,此类方法受到平行语料库的质量和规模的限制,且精度低下。针对此问题,该文提出了一种基于单语语料的面向日语假名的日汉人名翻译对自动抽取方法。该方法首先使用条件随机场模型,分别从日语和汉语语料库中抽取日语和汉语人名;然后,采用基于实例的归纳学习法自动获取人名实体的日汉音译规则库,并通过反馈学习来迭代重构音译规则库。使用音译规则库计算日汉人名实体之间的相似度,给定阈值判定人名实体翻译等价对。实验结果表明,提出的方法简单高效,在实现系统高精度的同时,克服了传统方法对双语资源的依赖性。
  相似文献   

8.
介绍从平行语料库中如何抽取双语短语翻译对。首先用统计模型正则期望从汉语专利语料库中抽取汉语短语。抽取的短语利用统计知识和语言学知识来过滤,使得过滤后汉语短语的正确率较高;其次,利用词对齐工具Giza++从汉英平行语料库中抽取词汇对齐,在词汇对齐的基础上利用开源工具Moses抽取汉英短语对齐,根据短语对齐与抽取出的高质量汉语短语的交集来抽取候选的汉英互译的源语言短语;接着使用停用词、对数似然估计法LLR和上下文熵来对英语短语翻译进行过滤。实验结果表明,过滤后,抽取的汉语短语准确率为97.6%,汉英短语翻译对的准确率为92.4%。  相似文献   

9.
多语种翻译词汇的在线自动抽取   总被引:1,自引:0,他引:1  
越来越多网页以多种语言的形式在互联网上传播,从中抽取多语种翻译词汇具有重要的研究价值.针对网页的特点,提出了一种新的多语种翻译词汇的在线自动抽取方法.该方法通过对双语网页中超链接信息相似度的计算,获取多语种翻译词汇,相似性越高,对应的词条互为翻译对的可能性越大.通过对中英、德英、法英3类双语网页的抽取,结果证明它具有较高的准确率,是一种高效的与语言无关的多语种词汇对抽取方法.  相似文献   

10.
在对Verilog和VHDL两种语言进行全面分析比较的基础上,依据统一的模拟时序模型和设计引用层次,采用模拟语义制导的方法完成从Verilog描述向VHDL描述的翻译转换.在保持功能等价和可综合性的同时,减少对语法和描述风格的限制.最后给出一些典型翻译实例.  相似文献   

11.
介绍了油库智能管理控制系统的软件结构及油情检测子系统、发油子系统、MIS系统、远程查询子系统的功能,最后给出了本文的结论。  相似文献   

12.
13.
在安全协议的形式化分析研究当中,如何在统一的框架下对更多的安全属性进行分析和验证是一个亟待解决的重要问题。为了解决这个问题,本文提出了用匹配关系来形式化地描述各种安全属性的统一框架,建立了语法和语意系统,并证明了该框架的可靠性和完备性。在此基础上,将知识推理和进程演算结合起来,提出了一个安全协议形式化分析的一般模型。最后,给出了一些安全属性的研究实例,并指出了进一步完善此模型的研究方向。  相似文献   

14.
该文针对中间件WebSphere性能问题的发现与处理进行研究,详细论述了WebSphere应用中性能调优的相关技术与方法,依据该文所论述的方法,可以使中间件WebSphere的性能达到相对最优。  相似文献   

15.
基于小波分析的一种自适应图像压缩编码   总被引:4,自引:0,他引:4  
文章在研究近年来基于小波变换的图像压缩编码方法的基础上,提出了一种自适应的小波分解方案。即在一定的能量准则下,根据子图像的能量大小决定是否进行小波分解,并由此导出自适应小波分解树和可调压比方案,然后结合自适应小波分解树的特性,给出恰当的小波系数量化、比特分配以及各层子图像的编码方案。实验表明,该文算法广泛适用于不同特征的数字图像,在较高压缩比时仍有较好的重建图像质量,而且压缩比在一定范围内可以调节。在相近压缩比的情况下,主观视觉质量和峰值信噪比都明显优于JPEG标准。  相似文献   

16.
一类多随机顾客流排队系统模型的计算机模拟   总被引:6,自引:0,他引:6  
本文讨论了服务时间与队长有关的多随机顾客流的排队系统模拟。在单服务台、串联及并联多服务台情形下建立了六个模拟模型。这一类模型在网络、多用户系统等方面的性能分析和设计都有较广泛的应用。本文最后给出模拟模型的计算实例。  相似文献   

17.
概率逻辑公式集分解的合并聚类算法   总被引:1,自引:2,他引:1  
为使概率逻辑的不确定性推理方法能应用于较大规模的知识库,本文基于一个实际专家系统知识库的开发经验,在概率逻辑公式一致性区间的一般算法基础上,为概率逻辑公式集的分解设计了一种合并聚类算法.对于不同背景的概率逻辑知识库,只要公式集具有一定的分层结构性质,该算法就能保证Dantzig-Wolfe分解的联合计算模型适用于概率逻辑推理.测试结果表明,该算法对于数10个变量和子句的实例可收到很好的效果.  相似文献   

18.
一种有效的Web性能测试方法及其应用*   总被引:11,自引:0,他引:11  
针对Web应用软件的特征,提出了一种基于目标的性能测试方法,其关注的主要内容包括与Web应用相关的负载测试和压力测试两个方面。不但对这两个方面的测试方法进行了全面的分析和探讨,还强调了测试过程管理的重要作用,最后给出了这种方法在Web应用性能测试实践中的一个具体应用。  相似文献   

19.
20.
为获得比较理想的直流输出电压,优化变换器的动态性能,基于Buck变换器采用新型滑模变结构控制策略,阐述其工作原理,并结合状态方程,推导出滑模面的存在条件和到达条件,然后对电路参数及控制系数进行设计.仿真结果表明采用这种新型滑模控制策略的Buck变换器对系统扰动和负载变化具有很强的鲁棒性,系统具有良好的动态响应.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号