首页 | 本学科首页   官方微博 | 高级检索  
     

基于概念相似度的文本相似计算
引用本文:彭京,杨冬青,唐世渭,王腾蛟,高军.基于概念相似度的文本相似计算[J].中国科学F辑:信息科学,2009(5):534-544.
作者姓名:彭京  杨冬青  唐世渭  王腾蛟  高军
作者单位:北京大学信息科学技术学院;高可信软件技术教育部重点实验室;成都市公安局科技处
基金项目:中国博士后科学基金(批准号:20060400002);四川省青年科技基金(批准号:07ZQ026-55,08ZQ026-016);国家自然科学基金(批准号:60473051,60503037);国家高技术研究发展计划(批准号:2006AA01Z230);北京市自然科学基金(批准号:4062018)资助项目
摘    要:根据概念相似信息,文中提出了一种新的文本相似度计算方法.新方法首先将文本转换为词向量空间模型,然后将词分解为概念集合,通过计算概念间的内积空间,得到词之间的相似度,最后根据词之间的相似度,计算文本相似性.文中的主要工作包括:1)提出了一种新的词相似度计算公式;2)提出了一种新的基于词相似度的文本相似计算方法;3)成功的将该方法应用到WEB新闻相似查询中;4)通过实验证明算法的有效性.

关 键 词:概念相似度  相似计算  向量空间  内积空间
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号