首页 | 本学科首页   官方微博 | 高级检索  
     

汉英双语平行语料库的词义标注
引用本文:刘冬明,杨尔弘,方莹. 汉英双语平行语料库的词义标注[J]. 中文信息学报, 2005, 19(6): 52-58
作者姓名:刘冬明  杨尔弘  方莹
作者单位:1. 中北大学计算机科学与技术系,山西太原 030051 ; 2. 山西大学计算机与信息技术学院,山西太原 030006
摘    要:本文充分利用当前HowNet 资源中概念的可计算性和句子对齐的汉英双语平行语料库信息,将词义排歧的问题转化为两种语言相对应句子词义组合的相似度计算问题,进而利用动态规划法的思想设计出一种在一定的时间复杂度内,有效的标出多义词义项的算法。该方法从以前对每个多义词进行排歧时只考察其上下文环境和对应信息,改变到对句子中所有的词同时考察上下文环境,这样就可以站在句子高度来进行词义标注,最终取得了满意的实验结果。

关 键 词:人工智能  自然语言处理  词义排歧  HowNet   双语平行语料库  
文章编号:1003-0077(2005)06-0050-07
收稿时间:2004-01-13
修稿时间:2004-12-14

Word Sense Tagging in Chinese- English Parallel Corpora
LIU Dong-ming,YANG Er-hong,FANG Ying. Word Sense Tagging in Chinese- English Parallel Corpora[J]. Journal of Chinese Information Processing, 2005, 19(6): 52-58
Authors:LIU Dong-ming  YANG Er-hong  FANG Ying
Affiliation:1.North University of China , Taiyuan , Shanxi 030051 , China ; 2. Shanxi University , Taiyuan , Shanxi 030006 , China
Abstract:Taking full advantage of the computability of the concept in the HowNet,this paper changes word sense tagging in Chinese-English parallel corpora into the similarity calculation between the concept combinations of the aligned sentences of the two languages.At the same time,the dynamic planning thought is used in order to reduce the time complexity of the algorithm.The current word sense tagging method in parallel corpora only used the context of the single ambiguous word and alignment information,but this method can take into account the all words' context in the aligned sentences together.In this way it can settle the problem from the viewpoint of the whole sentence and achieve the satisfactory result.
Keywords:HowNet
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号