首页 | 本学科首页   官方微博 | 高级检索  
     

基于Wikipedia的短文本语义相关度计算方法
引用本文:王荣波,谌志群,周建政,李治,高飞.基于Wikipedia的短文本语义相关度计算方法[J].计算机应用与软件,2015,32(1).
作者姓名:王荣波  谌志群  周建政  李治  高飞
作者单位:1. 杭州电子科技大学认知与智能计算研究所 浙江杭州310018
2. 天格科技(杭州)有限公司 浙江杭州310005
基金项目:教育部人文社会科学研究青年基金项目,杭州市科技发展计划重大科技创新专项
摘    要:语义相关度计算是自然语言处理领域的研究热点。现有的以文本相似度计算代替文本相关度计算的方法存在不足之处。提出从语形相似性和组元相关性两个方面来综合度量短文本之间的语义相关性,并提出2个以Wikipedia作为外部知识库的短文本相关度计算算法:最大词语关联法和动态组块法。在一个网络短文本测试集上对算法进行测评。实验结果表明,该算法与典型相似度计算算法比较,在正确率方面提高了20%以上。

关 键 词:短文本  Wikipedia  相关度计算  自然语言处理

SHORT TEXTS SEMANTIC RELEVANCE COMPUTATION METHOD BASED ON WIKIPEDIA
Wang Rongbo,Chen Zhiqun,Zhou Jianzheng,Li Zhi,Gao Fei.SHORT TEXTS SEMANTIC RELEVANCE COMPUTATION METHOD BASED ON WIKIPEDIA[J].Computer Applications and Software,2015,32(1).
Authors:Wang Rongbo  Chen Zhiqun  Zhou Jianzheng  Li Zhi  Gao Fei
Abstract:
Keywords:Short texts  Wikipedia  Relevance computation  Natural language processing
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号