首页 | 本学科首页   官方微博 | 高级检索  
     

基于朴素贝叶斯模型的单词语义相似度度量
引用本文:王俊华,左万利,闫昭.基于朴素贝叶斯模型的单词语义相似度度量[J].计算机研究与发展,2015(7).
作者姓名:王俊华  左万利  闫昭
作者单位:1. 吉林大学计算机科学与技术学院 长春 130012; 符号计算与知识工程教育部重点实验室 吉林大学 长春 130012; 长春工业大学计算机科学与工程学院 长春 130012
2. 吉林大学计算机科学与技术学院 长春 130012; 符号计算与知识工程教育部重点实验室 吉林大学 长春 130012
基金项目:国家自然科学基金项目(60973040);国家自然科学青年基金项目(60903098,61300148);吉林省重点科技攻关项目(20130206051GX);吉林省科技计划青年基金项目
摘    要:单词语义相似度度量是自然语言处理领域的经典和热点问题.通过结合朴素贝叶斯模型和知识库,提出一个新颖的度量单词语义相似度度量途径.首先借助通用本体 WordNet 获取属性变量,然后使用统计和分段线性插值生成条件概率分布列,继而通过贝叶斯推理实现信息融合获得后验概率,并在此基础上量化单词语义相似度.主要贡献是定义了单词对距离和深度,并将朴素贝叶斯模型用于单词语义相似度度量.在基准数据集 R&G(65)上,对比算法评判结果与人类评判结果的相关度,采用5折交叉验证对算法进行分析,样本 Pearson 相关度达到0.912,比当前最优方法高出0.4%,比经典算法高出7%~13%;Spearman 相关度达到0.873,比经典算法高出10%~20%;且算法的运行效率和经典算法相当.实验结果显示将朴素贝叶斯模型和知识库相结合解决单词语义相似度问题是合理有效的.

关 键 词:单词语义相似度  语义相似度  分段线性插值  朴素贝叶斯模型  WordNet
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号