OpenConcepts:一个开放的细粒度中文概念知识图谱 |
| |
作者姓名: | 叶宏彬 张宁豫 陈华钧 邓淑敏 毕祯 陈想 |
| |
作者单位: | 1. 浙江大学AZFT知识引擎实验室;2. 浙江大学杭州国际科创中心 |
| |
基金项目: | 国家自然科学基金(91846204,U19B2027); |
| |
摘 要: | 知识图谱是通过符号形式描述世界万物的实体及其之间的关联关系,是一种具备强大知识处理能力的大规模语义网络。概念知识图谱是一种特殊的知识图谱,在语义搜索、自动问答等场景具有广泛的应用价值。之前的概念图谱较难覆盖长尾实体,且存在概念粒度较粗和更新困难等问题。针对这些问题,该文提出了一种全新的自动化概念图谱构建方法,能够自动地从海量文本及半结构化数据中构建细粒度的中文概念层次结构,还发布了一个开放的细粒度中文概念知识图谱OpenConcepts,包含440万概念核心实例,5万多个细粒度概念和1 300万概念-实例三元组,并提供相应的调用接口。
|
关 键 词: | 知识图谱 三元组抽取 关系分类 |
|
|