首页 | 本学科首页   官方微博 | 高级检索  
     

汉语词语语义相似度计算研究
引用本文:夏天.汉语词语语义相似度计算研究[J].计算机工程,2007,33(6):191-194.
作者姓名:夏天
作者单位:中国人民大学信息资源管理学院,北京,100872
基金项目:中国人民大学科学研究青年基金 , 数据工程与知识工程教育部重点实验室(中国人民大学)开放课题基金
摘    要:汉语词语的语义相似度计算是中文信息处理中的一个关键问题。该文提出了一种基于知网、面向语义、可扩展的相似度计算新方法,该方法从信息论的角度出发,定义了知网义原间的相似度计算公式,通过对未登录词进行概念切分和语义自动生成,解决了未登录词无法参与语义计算的难题,实现了任意词语在语义层面上的相似度计算。针对同义词词林的实验结果表明,该方法的准确率比现有方法高出近15个百分点。

关 键 词:词语相似度  知网  概念  义原
文章编号:1000-3428(2007)06-0191-04
修稿时间:2006-04-08

Study on Chinese Words Semantic Similarity Computation
XIA Tian.Study on Chinese Words Semantic Similarity Computation[J].Computer Engineering,2007,33(6):191-194.
Authors:XIA Tian
Affiliation:School of Information Resource Management, Renmin University of China, Beijing 100872
Abstract:Similarity computation of Chinese words is a key problem in Chinese information processing. This paper proposes a new method on similarity computation which is based on Hownet, geared to semantic and could be expanded. The new method defines a similarity computation formula among Hownet’s sememes according to information theory, finds a way out of the difficulty that OOV words cannot participate in semantic computation by implementing concept segmentation and automatic semantic production to OOV words, and realizes the similarity computation on the semantic level among arbitrary words finally. Experimental result of CILIN indicates that the accuracy rate of the new method is nearly 15% higher than present ones.
Keywords:Words similarity  Hownet  Concept  Sememe
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号