首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于知网的句子相似度计算方法
引用本文:程传鹏,吴志刚.一种基于知网的句子相似度计算方法[J].计算机工程与科学,2012,34(2):172-175.
作者姓名:程传鹏  吴志刚
作者单位:中原工学院计算机学院,河南郑州,450007
基金项目:河南省教育厅自然科学资助项目
摘    要:句子相似度是衡量文档相似度的基础,在自然语言处理领域中有着非常重要的作用。目前的句子相似度计算方法忽略了句子的结构对相似度的影响。本文在分析已有研究工作的基础上,提出了一种改进的句子相似度计算方法。依据知网对"实体概念"的描述,构造出义原的语义层次树,由各个义原在树中的相对位置,计算出义原之间的相似度。对三种义原加权求和得到词语之间的语义相似度。综合句子的表层相似度和句子的词语语义以及词语的相对位置关系,得到句子的整体相似度。实验表明,在同等的测试条件下,本文所提出的句子相似度计算方法在相似度比较上更符合人的直观感觉。

关 键 词:句子相似度  知网  表层相似度  语义偏移量

A Method of Sentence Similarity Computing Based on Hownet
CHENG Chuan-peng , WU Zhi-gang.A Method of Sentence Similarity Computing Based on Hownet[J].Computer Engineering & Science,2012,34(2):172-175.
Authors:CHENG Chuan-peng  WU Zhi-gang
Affiliation:(School of Computer Science,Zhongyuan Institute of Technology,Zhengzhou 450007,China)
Abstract:
Keywords:sentence similarity  hownet  surface similarity  semantic offset similarity
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号