首页 | 本学科首页   官方微博 | 高级检索  
     

一种实体描述短文本相似度计算方法
引用本文:秦添轶,林蝉,宋博宇,关毅.一种实体描述短文本相似度计算方法[J].电脑学习,2015(2).
作者姓名:秦添轶  林蝉  宋博宇  关毅
作者单位:1. 哈尔滨工业大学 计算机科学与技术学院,哈尔滨,150001
2. 哈尔滨工业大学 软件学院,哈尔滨,150001
基金项目:国家自然科学基金(60975077)。
摘    要:中文实体描述短文本具有词语稀疏、语义离散、用词随意等特点。本文分析《知网》义原网络和词语相似度的关系,提出了短文本间语义相似度部分和短文本分类部分相结合的实体描述短文本间相似度计算方法。语义相似度部分分析《知网》义原网络和词语间相似度的关系,在计算词语间相似度和短文本间相似度的过程中弱化了浅层《知网》义原影响并均衡了义原权重,使义原相似度计算结果更加合理。短文本分类部分将短文本分解为义原向量,根据特定领域短文本的义原分布情况进行短文本分类。两部分结合得到实体描述短文本间相似度。本文方法的有效性在百度知识图谱数据分析竞赛任务1的测试结果中得到了证明。

关 键 词:实体描述短文本  文本分类  文本相似度  《知网》
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号