首页 | 本学科首页   官方微博 | 高级检索  
     

知识图谱中实体相似度计算研究
引用本文:李 阳,高大启.知识图谱中实体相似度计算研究[J].中文信息学报,2017,31(1):140-146.
作者姓名:李 阳  高大启
作者单位:华东理工大学 计算机科学与工程系,上海 200237
基金项目:心血管疾病与肿瘤疾病中西医临床大数据处理分析与应用研究(2015AA020107)
摘    要:实体相似度的计算有诸多应用,例如,电商平台的相似商品推荐,医疗疗效分析中的相似病人组等。在知识图谱的实体相似度计算中,给出了每个实体的属性值,并对部分实体进行相似度的标注,要求能得到其他实体之间的相似度。该文把该问题归结为监督学习问题,提出一种通用的实体相似度计算方法,通过清洗噪声数据,对数值、列表以及文本等不同数据类型进行预处理,使用SVM, Logistic回归等分类模型、Random Forest等集成学习模型以及排序学习模型进行建模,得到了较好的结果。

关 键 词:实体相似度  监督学习  分类模型  集成学习  

Research on Entities Similarity Calculation in Knowledge Graph
LI Yang,GAO Daqi.Research on Entities Similarity Calculation in Knowledge Graph[J].Journal of Chinese Information Processing,2017,31(1):140-146.
Authors:LI Yang  GAO Daqi
Affiliation:Department of Computer Science and Engineering, East China
University of Science and Technology, Shanghai 200237, China
Abstract:Entities similarity is useful in many areas, such as recommendation system in E-commerce platforms, and patients grouping in healthcare, etc. In our task of calculating the entity similarity in a given knowledge graph, the attributes of every entity is provided, and a sample of entity pairs are provided with their similarity score. Therefore, we treat this task as a supervised learning problem, testing SVM, Logistic Regression, Random Forest, and Learning to rank models.
Keywords:entity similarity  supervised learning  classification model  ensemble learning  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号