首页 | 本学科首页   官方微博 | 高级检索  
     

基于词串粒度及权值的汉语句子相似度衡量
引用本文:王荣波,池哲儒,常宝宝,柏晓静.基于词串粒度及权值的汉语句子相似度衡量[J].计算机工程,2005,31(13):142-144.
作者姓名:王荣波  池哲儒  常宝宝  柏晓静
作者单位:1. 香港理工大学电子及资讯工程系多媒体信号处理中心,香港
2. 北京大学计算语言所,北京,100871
摘    要:提出了一种改进的汉语句子相似度衡量方法,用于基于实例的汉英机器翻译。该方法同时考虑了相同词串的数目及长度和对应的权值信息,克服了传统方法的显著不足,在理论上更有合理性。在小数据集上的实验也表明该方法是可行的。

关 键 词:基于实例机器翻译  汉英机器翻译  句子相似度衡量  自然语言处理
文章编号:1000-3428(2005)13-0142-03

Chinese Sentence Similarity Measure Based on Word Sequence Length and Word Weight
Wang Rongbo,Chi Zheru,CHANG Baobao,BAI Xiaojing.Chinese Sentence Similarity Measure Based on Word Sequence Length and Word Weight[J].Computer Engineering,2005,31(13):142-144.
Authors:Wang Rongbo  Chi Zheru  CHANG Baobao  BAI Xiaojing
Affiliation:WANG Rongbo1,CHI Zheru1,CHANG Baobao2,BAI Xiaojing2
Abstract:This paper proposes an improved Chinese sentence similarity measure for example-based Chinese to English translation. The length of identical word sequence and the weights of words in the sequence are considered in this method. The preliminary experimental results show that the measure work is well when it is tested on a small dataset.
Keywords:Example-based machine translation(EBMT)  Chinese-English machine translation  Sentence similarity measure  Natural language processing
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号