首页 | 本学科首页   官方微博 | 高级检索  
     

改进的自适应汉维句子对齐
引用本文:田生伟,禹龙,杨飞宇. 改进的自适应汉维句子对齐[J]. 计算机工程与应用, 2011, 35(35): 147-149
作者姓名:田生伟  禹龙  杨飞宇
作者单位:1. 新疆大学软件学院,乌鲁木齐,830008
2. 新疆大学网络中心,乌鲁木齐,830046
3. 新疆大学国际文化交流学院,乌鲁木齐,830046
基金项目:新疆自治区高校科研计划重点项目(No.XJEDU2009I05)
摘    要:提出了改进的自适应汉维句子对齐算法对齐汉维语句子。针对传统对齐方法不能较好地适应语料类型的变化,算法利用当前待对齐汉维文本的字节长度比和历史匹配模式数据,动态修正对齐模型的参数,使其适应语料类型的变化,提高了汉维句子对齐算法的性能,对齐的正确率和召回率较长度对齐模型分别提高了3.5个百分点和2.7个百分点,较混合对齐提高了1.9个百分点和1.8个百分点。实验结果验证了该算法能够有效地适应语料类型的变化。

关 键 词:双语语料  句子对齐  自适应
修稿时间: 

Improved adaptive algorithm for Chinese-Uyghur sentence alignment
TIAN Shengwei , YU Long , YANG Feiyu. Improved adaptive algorithm for Chinese-Uyghur sentence alignment[J]. Computer Engineering and Applications, 2011, 35(35): 147-149
Authors:TIAN Shengwei    YU Long    YANG Feiyu
Affiliation:TIAN Shengwei1,YU Long2,YANG Feiyu3 1.School of Software,Xinjiang University,Urumqi 830008,China 2.Network Center,Urumqi 830046,China 3.International Cultural Exchange College,China
Abstract:This paper proposes an improved adaptive algorithm for Chinese-Uyghur sentence alignment.Traditional alignment methods can not well adapt to change in types of corpus,the algorithm makes ues of current Chinese-Uyghur text length ratio of bytes and historical matching model,modifies the alignment model parameters dynamically to meet the changes in types of corpus and improves sentence alignment algorithm performance.Compared with alignment algorithm based on length,alignment improves alignment accuarcy 3.5 p...
Keywords:bilingual corpora  sentence alignment  adaptive
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号