首页 | 本学科首页   官方微博 | 高级检索  
     

一种维吾尔语句子相似度算法的研究
引用本文:田生伟,吐尔根·依布拉音,禹龙,买合木提·木合买提,艾山·吾买尔.一种维吾尔语句子相似度算法的研究[J].计算机工程与应用,2009,45(26):144-146.
作者姓名:田生伟  吐尔根·依布拉音  禹龙  买合木提·木合买提  艾山·吾买尔
作者单位:1. 新疆大学信息科学与工程学院,乌鲁木齐,830046
2. 新疆大学网络中心,乌鲁木齐,830046
摘    要:基于实例的机器翻译是一种重要的机器翻译技术,句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的维吾尔语机器翻译研究,维吾尔语句子相似度衡量的准确性,直接影响到最后翻译结果的输出。提出了一种维吾尔语句子相似度的计算方法,采用的基于词形特征的粗选算法、散列单词倒排索引能够有效提高算法的查找速度,快速从语料库中筛选出候选句子集合;多策略精选算法中采用基于维吾尔语词频的单词区分度算法、连续单词序列抽取算法,可以有效衡量两个维吾尔语句子的相似程度,实验结果证明算法是有效的。

关 键 词:机器翻译  基于实例机器翻译  维吾尔语句子相似度
收稿时间:2008-6-3
修稿时间:2008-7-28  

Similarity measure algorithm of Uyhur sentence
TIAN Sheng-wei,Turgun Ibrahim,YU Long,Mahmut Muhammad,Hasan Uma.Similarity measure algorithm of Uyhur sentence[J].Computer Engineering and Applications,2009,45(26):144-146.
Authors:TIAN Sheng-wei  Turgun Ibrahim  YU Long  Mahmut Muhammad  Hasan Uma
Affiliation:TIAN Sheng-wei1,Turgun Ibrahim1,YU Long2,Mahmut Muhammad1,Hasan Uma1 1.Information Science , Engineering Technology Institute,Xinjiang University,Urumqi 830046,China 2.Network Center,China
Abstract:Example-Based Machine Translation(EBMT) is an important branch of machine translation.Sentence similarity measure certainly is one of the most important problems addressed in EBMT,the performance of similarity measure of Uyhur sentences affects directly final translation result of an input sentence.This paper proposes a similarity measure algorithm of Uyhur sentence. The retrieval approach of candidate translation examples based on word surface features and word inverted index can get candidate sentence set...
Keywords:machine translation  example-based machine translation  Uyhur sentence similarity
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号