共查询到20条相似文献,搜索用时 156 毫秒
1.
回顾了语料库分类及可比语料库中翻译等价对抽取方法研究的历史。根据从可比语料库中提取翻译等价对所依据的基本假设:一个语言中一个词在对应到另外一种语言时其与周围词之间的共现搭配关系仍然被保持,采用双向等价对获取计算然后求交集、词加权因数TF(iw)*IDF(i)值计算、上下文词的词性信息利用的方法来提高翻译等价对提取正确率。描述了翻译等价对抽取实验步骤,并对实验结果进行了简要分析。实验结果表明上述方法可以有效提高翻译等价对计算结果的正确率。最后提出了需要进一研究的问题。 相似文献
2.
3.
有关命名实体的翻译等价对在多语言处理中有着非常重要的意义。在过去的几年里,双语字典查找,音译模型等方法先后被提出。另一种极具价值的方法是从平行语料库中自动抽取有关命名实体的翻译等价对,现有的方法要求预先对双语语料库的两种语言文本进行命名实体标注。提出了一种只要求对语料库中源语言进行命名实体标注,目标语言不需标注,然后利用训练得到的HMM词对齐结果来抽取有关命名实体翻译等价对的方法。在实验中,把中文作为源语言,英文作为目标语言。实验结果表明用该方法,即使在对齐模型只是部分准确的情况下,也得到了较高正确率的命名实体翻译等价对。 相似文献
4.
翻译等价对在词典编纂、机器翻译和跨语言信息检索中有着广泛的应用。文章从双语句对的译文等价树中抽取翻译等价对。使用译文直译率、短语对齐概率和目标语-源语言短语长度差异等特征对自动获取的等价对进行评价。提出了一种基于多重线性回归模型的等价对评价方法,并结合N-Best策略对候选翻译等价对进行过滤。实验结果表明:在开放测试中,基于多重线性回归模型的等价对评价及过滤方法其性能要优于其它方法。 相似文献
5.
提出一种改进的短语抽取算法,该算法首先考虑词对齐矩阵中一个汉语词对齐到多个维语词的情况(包括不连续),然后采用Och方法进行判断.如果满足条件则进行短语抽取.试验结果表明,改进后的短语抽取算法能够抽取出更多汉维短语对,提高短语翻译对抽取的效果. 相似文献
6.
翻译模板自动获取是提高MT译文输出质量和领域适应能力的关键性因素。利用Tree-to-String方法抽取等价对,使用错误驱动的学习方法从中获取翻译模板并进行优化。将优化后的翻译模板用于一个基于转换的机器翻译系统中,同时使用“863”对话语料对其进行评测。实验结果表明:当使用自动获取并经优化的模板进行翻译时,开放测试语料的译文评测分数有一定程度的提高。 相似文献
7.
命名实体的翻译等价对在跨语言信息处理中非常重要。传统抽取方法通常使用平行语料库或可比语料库,此类方法受到语料库资源的质量和规模的限制。在日汉翻译领域,一方面,双语资源相对匮乏;另一方面,对于汉字命名实体,通常使用汉字对照表;对于日语纯假名的命名实体,通常采用统计翻译模型,此类方法受到平行语料库的质量和规模的限制,且精度低下。针对此问题,该文提出了一种基于单语语料的面向日语假名的日汉人名翻译对自动抽取方法。该方法首先使用条件随机场模型,分别从日语和汉语语料库中抽取日语和汉语人名;然后,采用基于实例的归纳学习法自动获取人名实体的日汉音译规则库,并通过反馈学习来迭代重构音译规则库。使用音译规则库计算日汉人名实体之间的相似度,给定阈值判定人名实体翻译等价对。实验结果表明,提出的方法简单高效,在实现系统高精度的同时,克服了传统方法对双语资源的依赖性。
相似文献
相似文献
8.
介绍从平行语料库中如何抽取双语短语翻译对。首先用统计模型正则期望从汉语专利语料库中抽取汉语短语。抽取的短语利用统计知识和语言学知识来过滤,使得过滤后汉语短语的正确率较高;其次,利用词对齐工具Giza++从汉英平行语料库中抽取词汇对齐,在词汇对齐的基础上利用开源工具Moses抽取汉英短语对齐,根据短语对齐与抽取出的高质量汉语短语的交集来抽取候选的汉英互译的源语言短语;接着使用停用词、对数似然估计法LLR和上下文熵来对英语短语翻译进行过滤。实验结果表明,过滤后,抽取的汉语短语准确率为97.6%,汉英短语翻译对的准确率为92.4%。 相似文献
9.
多语种翻译词汇的在线自动抽取 总被引:1,自引:0,他引:1
越来越多网页以多种语言的形式在互联网上传播,从中抽取多语种翻译词汇具有重要的研究价值.针对网页的特点,提出了一种新的多语种翻译词汇的在线自动抽取方法.该方法通过对双语网页中超链接信息相似度的计算,获取多语种翻译词汇,相似性越高,对应的词条互为翻译对的可能性越大.通过对中英、德英、法英3类双语网页的抽取,结果证明它具有较高的准确率,是一种高效的与语言无关的多语种词汇对抽取方法. 相似文献
10.
在对Verilog和VHDL两种语言进行全面分析比较的基础上,依据统一的模拟时序模型和设计引用层次,采用模拟语义制导的方法完成从Verilog描述向VHDL描述的翻译转换.在保持功能等价和可综合性的同时,减少对语法和描述风格的限制.最后给出一些典型翻译实例. 相似文献
11.
介绍了油库智能管理控制系统的软件结构及油情检测子系统、发油子系统、MIS系统、远程查询子系统的功能,最后给出了本文的结论。 相似文献
12.
13.
该文针对中间件WebSphere性能问题的发现与处理进行研究,详细论述了WebSphere应用中性能调优的相关技术与方法,依据该文所论述的方法,可以使中间件WebSphere的性能达到相对最优。 相似文献
14.
15.
一类多随机顾客流排队系统模型的计算机模拟 总被引:6,自引:0,他引:6
吴庆标 《计算机应用与软件》1996,13(1):12-16
本文讨论了服务时间与队长有关的多随机顾客流的排队系统模拟。在单服务台、串联及并联多服务台情形下建立了六个模拟模型。这一类模型在网络、多用户系统等方面的性能分析和设计都有较广泛的应用。本文最后给出模拟模型的计算实例。 相似文献
16.
基于小波分析的一种自适应图像压缩编码 总被引:4,自引:0,他引:4
文章在研究近年来基于小波变换的图像压缩编码方法的基础上,提出了一种自适应的小波分解方案。即在一定的能量准则下,根据子图像的能量大小决定是否进行小波分解,并由此导出自适应小波分解树和可调压比方案,然后结合自适应小波分解树的特性,给出恰当的小波系数量化、比特分配以及各层子图像的编码方案。实验表明,该文算法广泛适用于不同特征的数字图像,在较高压缩比时仍有较好的重建图像质量,而且压缩比在一定范围内可以调节。在相近压缩比的情况下,主观视觉质量和峰值信噪比都明显优于JPEG标准。 相似文献
17.
18.
19.