基于概念相似度的文本相似计算 |
| |
引用本文: | 彭京,杨冬青,唐世渭,王腾蛟,高军.基于概念相似度的文本相似计算[J].中国科学F辑:信息科学,2009(5):534-544. |
| |
作者姓名: | 彭京 杨冬青 唐世渭 王腾蛟 高军 |
| |
作者单位: | 北京大学信息科学技术学院;高可信软件技术教育部重点实验室;成都市公安局科技处 |
| |
基金项目: | 中国博士后科学基金(批准号:20060400002);四川省青年科技基金(批准号:07ZQ026-55,08ZQ026-016);国家自然科学基金(批准号:60473051,60503037);国家高技术研究发展计划(批准号:2006AA01Z230);北京市自然科学基金(批准号:4062018)资助项目 |
| |
摘 要: | 根据概念相似信息,文中提出了一种新的文本相似度计算方法.新方法首先将文本转换为词向量空间模型,然后将词分解为概念集合,通过计算概念间的内积空间,得到词之间的相似度,最后根据词之间的相似度,计算文本相似性.文中的主要工作包括:1)提出了一种新的词相似度计算公式;2)提出了一种新的基于词相似度的文本相似计算方法;3)成功的将该方法应用到WEB新闻相似查询中;4)通过实验证明算法的有效性.
|
关 键 词: | 概念相似度 相似计算 向量空间 内积空间 |
本文献已被 维普 等数据库收录! |
|