首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于WordNet的混合式语义相似度计算方法
引用本文:张思琪,邢薇薇,蔡圆媛.一种基于WordNet的混合式语义相似度计算方法[J].计算机工程与科学,2017,39(5):971-977.
作者姓名:张思琪  邢薇薇  蔡圆媛
作者单位:;1.北京交通大学软件学院
基金项目:国家自然科学基金(61272353,61370128,61428201);教育部新世纪人才计划(NCET-13-0659);北京高校青年英才计划(YETP0583)
摘    要:语义相似度的计算是自然语言处理中的重要研究内容,在过去几十年的研究工作中,已有大量的语义相似度计算方法被提出并广泛应用于语义消歧、文本聚类等领域中。基于WordNet本体,改进了信息量IC计算模型,进而提出了两种混合式的语义相似度的计算方法。实验结果表明,由于同时考虑了概念节点在WordNet中的最短路径距离和IC语义距离,所提方法优于已有方法,其计算结果更加接近人类的主观判断。

关 键 词:WordNet  语义相似度  信息量  本体
收稿时间:2015-09-10
修稿时间:2017-05-25

A WordNet-based hybrid semantic similarity measurement
ZHANG Si-qi,XING Wei-wei,CAI Yuan-yuan.A WordNet-based hybrid semantic similarity measurement[J].Computer Engineering & Science,2017,39(5):971-977.
Authors:ZHANG Si-qi  XING Wei-wei  CAI Yuan-yuan
Affiliation:(School of Software Engineering,Beijing Jiaotong University,Beijing 100044,China)
Abstract:Calculation of semantic similarity is an important research content of natural language processing (NLP), and many measurements have been proposed for the past few decades. These measurements have been widely used in word sense disambiguation, text clustering and other research fields. We propose a new measurement to calculate information content (IC) with WordNet ontology, and then propose two new hybrid measurements to calculate semantic similarity. Experimental results show that the proposed method is better than the existing methods for considering both the shortest path distance and the IC semantic distance simultaneously, and the results are more close to human judgment.
Keywords:WordNet  semantic similarity  information content  ontology  
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号