首页 | 本学科首页   官方微博 | 高级检索  
     

混合策略的汉维句子对齐
引用本文:田生伟,吐尔根·依布拉音,禹龙. 混合策略的汉维句子对齐[J]. 计算机工程与应用, 2010, 46(34): 143-145. DOI: 10.3778/j.issn.1002-8331.2010.34.043
作者姓名:田生伟  吐尔根·依布拉音  禹龙
作者单位:1.新疆大学 信息科学与工程学院,乌鲁木齐 830046 2.新疆大学 网络中心,乌鲁木齐 830046
基金项目:国家自然科学基金,新疆自治区高校科研计划项目
摘    要:提出了一种混合算法对齐汉维句子,不需要汉语分词、词性标注预处理,利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,作为基于词汇对齐的词典,并结合基于长度的方法进行句子对齐,实验结果验证了该混合算法的有效性,汉维语句子对齐的正确率和召回率,达到了97.5%和97.1%。

关 键 词:双语语料  句子对齐  混合策略
收稿时间:2009-04-10
修稿时间:2009-6-5 

Chinese-Uyhur sentence alignment based on hybrid strategy
TIAN Sheng-wei,TURGUN Ibrahim,YU Long. Chinese-Uyhur sentence alignment based on hybrid strategy[J]. Computer Engineering and Applications, 2010, 46(34): 143-145. DOI: 10.3778/j.issn.1002-8331.2010.34.043
Authors:TIAN Sheng-wei  TURGUN Ibrahim  YU Long
Affiliation:1.Information Science and Engineering Technology Institute,Xinjiang University,Urumqi 830046,China 2.Network Center,Xinjiang University,Urumqi 830046,China
Abstract:This paper proposes a new approach to align Chinese-Uyhur sentences in the parallel texts.This approach avoids complicated Chinese processing further, such as segmentation and part of speech tagging.The lexical correspondence information is extracted from the bilingual corpora and used as the lexicon of lexicon-method model, combined with length-based approach, the hybrid approach improves the alignment accuracy and recall,and gets an encouraging 97.5% precision and 97.1% recall.
Keywords:bilingual corpora  sentence alignment  hybrid strategy
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号