首页 | 本学科首页   官方微博 | 高级检索  
     

融合实体外部知识的远程监督关系抽取方法
引用本文:高建伟,万怀宇,林友芳.融合实体外部知识的远程监督关系抽取方法[J].计算机研究与发展,2022(12):2794-2802.
作者姓名:高建伟  万怀宇  林友芳
作者单位:北京交通大学计算机与信息技术学院
基金项目:国家重点研发计划项目(2018YFC0830200)~~;
摘    要:远程监督关系抽取旨在从无结构化的文本当中发现关系事实,它对许多下游任务有着非常重要的意义.虽然远程监督可以自动地生成大量带标签的训练样本,但是自动标注的过程不可避免地会遇到噪声数据的问题.当前的许多研究工作主要把关注点放在降噪的过程当中,尝试通过选择出正确的句子来生成更有效的包级别特征表示.但是在文本语料之外,还存在着大量与实体相关的外部知识没有被充分利用,而这些知识能够帮助模型更好地理解实体之间的关系.基于这一观察,提出了一种新颖的远程监督关系抽取方法,该方法通过利用外部知识图谱当中的结构化知识和文本语料中的语义知识,设计了一种实体知识感知的词嵌入表示方法,来丰富句子级别的特征表达能力.实验结果表明,在2个版本的大规模“纽约时报”基准数据集上,该方法都明显优于其他方法.此外,还通过对比实验进一步探索了2个版本的数据集所存在的差异,其中无实体交集的数据集能够更有效地反映模型性能.

关 键 词:关系抽取  远程监督  知识表示  词嵌入  门控机制
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号