摘 要: | 知识图谱可辅助现场人员处理配电网运行过程中积累的海量异构文本,挖掘高价值运行信息。针对知识图谱构建需求人工标注成本过高的问题,提出一种基于知识增强的远程监督关系抽取方法。利用GloVe编码与Bi-GRU网络对配电网运行语料库的句包进行向量表征;同时,新增外部知识增强模块,通过Attention-GCN模型获取编码文本的句法结构以及非线性关系,实现低成本的关系抽取,解决传统远程监督学习存在的长尾分布及噪声问题,提升关系抽取精度。实验结果表明,该方法在配电网运行信息关系抽取任务中表现优秀,相较于主流模型在精确率上提升6%。
|