首页 | 本学科首页   官方微博 | 高级检索  
     

多策略机器翻译系统IHSMTS中候选实例模式检索算法
引用本文:张孝飞,陈肇雄,黄河燕,代六玲.多策略机器翻译系统IHSMTS中候选实例模式检索算法[J].小型微型计算机系统,2005,26(3):330-334.
作者姓名:张孝飞  陈肇雄  黄河燕  代六玲
作者单位:1. 中国科技大学,计算机系,安徽,合肥,230000;中国科学院,计算机语言信息工程研究中心,北京,100083
2. 中国科学院,计算机语言信息工程研究中心,北京,100083
3. 中国科学院,计算机语言信息工程研究中心,北京,100083;南京理工大学,计算机系,江苏,南京,210094
基金项目:国家自然科学基金项目(60272088)资助.
摘    要:基于实例的机器翻译系统EBMT都需要有一个非常大的实例模式库,其数量级通常在百万句对以上.因此,如何从中快速地选择出一定数量的与待翻译的输入句子比较相似的候选实例,提供给后续句子相似度计算、类比译文构造等模块作进一步的处理,是EBMT系统所必须解决的一大难题.文章基于句子的词表层特征和信息熵提出了一种多层次候选实例模式检索算法,通过在多策略机器翻译系统IHSMTS上的运行测试。结果表明该算法较好的解决了这一难题.

关 键 词:基于实例的机器翻译  实例模式库  候选实例  词表层特征  信息熵
文章编号:1000-1220(2005)03-0330-05

Retrieval Approach of Candidate Translation Examples in Interactive Hybrid Strategies Machine Translation System IHSMTS
ZHANG Xiao-fei,CHEN Zhao-xiong,HUANG He-yan,DAI Liu-ling.Retrieval Approach of Candidate Translation Examples in Interactive Hybrid Strategies Machine Translation System IHSMTS[J].Mini-micro Systems,2005,26(3):330-334.
Authors:ZHANG Xiao-fei  CHEN Zhao-xiong  HUANG He-yan  DAI Liu-ling
Affiliation:ZHANG Xiao-fei~1,2,CHEN Zhao-xiong2,HUANG He-yan2,DAI Liu-ling~2,3 1
Abstract:EBMT system often requires a large corpus of translation examples which is on the order of millions sentence pairs. So the difficulty how to fast and effectively retrieve an amount of candidate translation examples which are useful for latter translation by analogy reasoning from the corpora must be resolved for any application EBMT system. In this paper, a multi-layer retrieval approach of candidate translation examples is proposed based on word surface features and word entropy. The approach is tested on an application MT system, and the test result show that the approach effectively resolves the problem of the retrieval of candidate translation examples.
Keywords:EBMT  corpora of translation example  candidate translation example  word surface features  entropy
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号