首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的基于《知网》的词语语义相似度计算
引用本文:江敏,肖诗斌,王弘蔚,施水才. 一种改进的基于《知网》的词语语义相似度计算[J]. 中文信息学报, 2008, 22(5): 84-89
作者姓名:江敏  肖诗斌  王弘蔚  施水才
作者单位:1. 北京信息科技大学 中文信息处理研究中心,北京 100101;2. 北京拓尔思信息技术股份有限公司,北京 100101
基金项目:国家高技术研究发展计划(863计划),国家自然科学基金,北京市属市管高校人才强教计划,北京市教委科技发展计划项目
摘    要:中科院刘群的基于《知网》的词语相似度计算是当前比较有代表性的计算词语相似度的方法之一。在测试中我们发现对一些存在对义或反义的词语与同义、近义词语一样具有较高的相似度,一些明显相似的词反而相似度较低,如“美丽”与“贼眉鼠眼”的相似度为0.814 815,与“优雅”的相似度为0.788 360 ,“深红”与“粉红”的相似度仅为0.074 074,这将不利于进行词语的极性识别。基于文本情感色彩分析的需要,把词语相似度的取值范围规定为[-1,+1],在刘群论文的基础上,进一步考虑了义原的深度信息,并利用《知网》义原间的反义、对义关系和义原的定义信息来计算词语的相似度。在词语极性识别实验中,得到了较好的实验结果P值为99.07%,R值为99.11%。

关 键 词:计算机应用  中文信息处理  知网  词语相似度  义原  词语极性识别  

An Improved Word Similarity Computing Method Based on HowNet
JIANG min,XIAO Shi-bin,WANG Hong-wei,SHI Shui-cai. An Improved Word Similarity Computing Method Based on HowNet[J]. Journal of Chinese Information Processing, 2008, 22(5): 84-89
Authors:JIANG min  XIAO Shi-bin  WANG Hong-wei  SHI Shui-cai
Affiliation:1.Chinese Information Processing Research Center, Beijing Information Science &
Technology University, Beijing 100101,China;
2.Beijing TRS Information Technology CO.LTD, Beijing 100101,China
Abstract:Word similarity computing based on the "HowNet" of Liu-Qun is a representative method to compute the word similarity.But it is found that some words with contrastive or contradictive meanings are computed with high similarity compared those true synonymous.To resolve this defect for the word polarity analysis,we confine the value of word similarity between in this paper,and enhance the word similarity computation on the basis of Liu's paper by employing sememes' depth information,the antonym and definition information of the sememe.This method produces a good performance in the word polarity recognition experiment,achieving 99.07% in accuracy and 99.11% in recall.
Keywords:computer application  Chinese information processing  HowNet  word similarity  sememe  word polarity recognition
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号