基于类型间关系学习的细粒度实体分类 |
| |
作者姓名: | 席鹏弼 靳小龙 白硕 |
| |
作者单位: | 1. 中国科学院计算技术研究所网络数据科学与技术重点实验室;2. 中国科学院大学计算机科学与技术学院;3. 恒生电子股份有限公司 |
| |
基金项目: | 国家自然科学基金(U1911401,61772501,62002341,U1836206)资助项目; |
| |
摘 要: | 细粒度实体分类旨在为构建知识图谱过程中所抽取的实体或实体提及确定一个或多个层次化、细粒度的类型,以便更好地为下游任务提供支持。现有细粒度实体分类方法存在细粒度分类精度不高、部分实体难以有效分类的问题。另一方面,直观来说,掌握细粒度类型之间的语义区别有助于实体的细粒度分类。但由于已有面向该任务的数据集缺少可用于学习细粒度类型间语义差别的数据,因此目前没有将细粒度类型之间的语义区别应用于细粒度实体分类的研究。为此,本文提出一种基于Freebase知识库学习细粒度类型语义区别的方法,并将学习到的语义信息应用在细粒度实体分类任务中。具体地,利用SPARQL从Freebase中获取类型之间的关系数据,据此学习细粒度实体类型之间的语义区别信息,进而结合实体提及及其上下文的文本信息进行细粒度实体分类。实验表明,本文提出的方法可以有效学习细粒度类型之间的语义区别,能够达到提升细粒度实体分类准确率的效果。
|
关 键 词: | 实体分类 细粒度类型 知识图谱构建 关系学习 多标签分类 |
|
|