大规模句子相似度计算方法 Approach of Large-Scale Sentence Similarity Computation期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

大规模句子相似度计算方法

引用本文：	黄河燕,陈肇雄,张孝飞,张克亮. 大规模句子相似度计算方法[J]. 中文信息学报, 2006, 20(Z1): 47-52

作者姓名：	黄河燕陈肇雄张孝飞张克亮

作者单位：	1. 中国科学院计算机语言信息工程研究中心,北京,100083 2. 中国科学院计算机语言信息工程研究中心,北京,100083;南京理工大学,江苏,南京,210094

基金项目：	中国科学院资助项目;国家科技攻关项目

摘要：	如何根据源语言文本从大规模语料库中找出其最相近的翻译实例,即句子相似度计算,是基于实例翻译方法的关键问题之一.本文提出一种多层次句子相似度计算方法首先基于句子的词表层特征和信息熵从大规模语料库中选择出少量候选实例,然后针对这些候选实例进行泛化匹配,从而计算出相似句子.在多策略机器翻译系统IHSMTS中的实验表明,当语料规模为20万英汉句对时,系统提取相似句子的召回率达96%,准确率达90%,充分说明了本文算法的有效性.
关键词：	句子相似度基于实例的机器翻译多策略机器翻译泛化匹配
文章编号：	1003-0077(2006)增刊-0047-06
修稿时间：	2005-11-05
Approach of Large-Scale Sentence Similarity Computation

HUANG He-yan,CHEN Zhao-xiong,ZHANG Xiao-fe,ZHANG Ke-Liang. Approach of Large-Scale Sentence Similarity Computation[J]. Journal of Chinese Information Processing, 2006, 20(Z1): 47-52

Authors:	HUANG He-yan CHEN Zhao-xiong ZHANG Xiao-fe ZHANG Ke-Liang

Abstract:

Keywords:
本文献已被万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏