首页 | 本学科首页   官方微博 | 高级检索  
     

基于贝叶斯估计的概念语义相似度算法
引用本文:吴奎,周献中,王建宇,赵佳宝.基于贝叶斯估计的概念语义相似度算法[J].中文信息学报,2010,24(2):52-58.
作者姓名:吴奎  周献中  王建宇  赵佳宝
作者单位:1. 南京理工大学 自动化学院,江苏 南京 210094;2. 南京大学 工程管理学院,江苏 南京 210093
基金项目:国家自然科学基金资助项目(90718036)
摘    要:传统的基于语义距离的概念语义相似度算法不能兼顾客观统计数据,基于信息量的相似度算法又难以获得权威统计样本,针对这些不足,该文提出一种基于贝叶斯估计的概念语义相似度算法。该算法首先假定概念出现概率是符合Beta分布的随机变量,然后基于语义距离的相似度算法计算先验参数,并根据统计样本计算该先验分布下基于最小风险的贝叶斯估计后验参数。随后利用基于信息量的语义相似度算法,便可获得主观经验与客观事实相结合的概念语义相似度。结合WordNet的实验分析表明,该算法与人为主观经验之间具有最大的相关系数。

关 键 词:计算机应用  中文信息处理  本体  语义相似度  贝叶斯估计  Beta分布  

A Concept Semantic Similarity Algorithm Based on Bayesian Estimation
WU Kui,ZHOU Xianzhong,WANG Jianyu,ZHAO Jiabao.A Concept Semantic Similarity Algorithm Based on Bayesian Estimation[J].Journal of Chinese Information Processing,2010,24(2):52-58.
Authors:WU Kui  ZHOU Xianzhong  WANG Jianyu  ZHAO Jiabao
Affiliation:1. School of Automation, Nanjing University of Science & Technology, Nanjing, Jiangsu 210094, China;
2. School of Management & Engineering, Nanjing University, Nanjing, Jiangsu 210093, China
Abstract:Traditional algorithms for semantic similarity computation fall into two categories: distance-based and information-based methods.The former ignores the objective statistics,while the latter suffers from insufficient domain data.In this paper,a new method for similarity computation based on Bayesian Estimation is proposed.First,the concept emergence probability is assumed to be a random variable with a priori Beta distribution.Second,its priori parameters are designated by the distance-based similarity algo...
Keywords:computer application  Chinese information processing  ontology  semantic similarity  Bayesian estimation  Beta distribution  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号