多策略中文开放关系抽取方法 |
| |
引用本文: | 温清华,朱洪银,侯磊,李涓子.多策略中文开放关系抽取方法[J].中文信息学报,2023(1):88-96. |
| |
作者姓名: | 温清华 朱洪银 侯磊 李涓子 |
| |
作者单位: | 1. 清华大学计算机科学与技术系;2. 清华大学知识工程实验室 |
| |
基金项目: | 国家自然科学基金(62006136); |
| |
摘 要: | 开放关系抽取从海量数据中获取知识,是自然语言处理的一个关键技术。开放关系抽取可以实现多种关系的抽取,由于中文领域可供训练的标注数据较少且语义句式较为复杂,面向中文的开放关系抽取存在较多困难。现有的中文开放关系抽取方法存在实体识别覆盖率较低且抽取关系种类单一的问题,无法满足知识图谱扩展等应用需求。该文提出了多策略的开放关系抽取方法,该方法综合利用知识图谱提高了实体识别的覆盖度,依靠实体上下文信息实现了实体对关系的抽取,根据依存句法分析抽取得到全要素三元组,并实现了从文本中抽取实体属性的方法。实验证明,该文的抽取方法准确率高,抽取关系种类多样,可以服务于知识图谱扩展等任务。
|
关 键 词: | 开放关系抽取 多策略 知识图谱 |
|
|