首页 | 本学科首页   官方微博 | 高级检索  
     

维-汉统计机器翻译中维吾尔语预处理研究
作者姓名:艾孜孜·吐尔逊  杨雅婷  吐尔洪·吾司曼  周俊林  李晓
作者单位:中国科学院新疆理化技术研究所;中国科学院大学;和田师范专科学校数学与信息学院;中国科学院新疆分院
摘    要:为有效降低维-汉统计机器翻译中语料质量对翻译质量的影响,对维吾尔语文本预处理技术进行研究,结合维吾尔语文本语料的语言特征和多样性,提出基于语法规则和词法规则结合的维吾尔语文本预处理方法。在对维吾尔语文本中的语义单元、对偶词和标点符号进行特征分析的基础上,导出维吾尔语文本词例化和标点符号规范化的规则和处理流程。实验结果表明,该研究有效降低了词对齐阶段的单词数量、缓解了数据稀疏,提高了翻译质量。

关 键 词:维汉机器翻译  维吾尔语  单词  词例化  标点符号
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号