基于负训练和迁移学习的关系抽取方法 |
| |
引用本文: | 陈克正,郭晓然,钟勇,李振平.基于负训练和迁移学习的关系抽取方法[J].计算机应用,2023(8):2426-2430. |
| |
作者姓名: | 陈克正 郭晓然 钟勇 李振平 |
| |
作者单位: | 1. 中国科学院成都计算机应用研究所;2. 中国科学院大学计算机科学与技术学院;3. 西北民族大学数学与计算机科学学院 |
| |
基金项目: | 中央高校基本科研业务费(青年教师创新)项目(31920210090)~~; |
| |
摘 要: | 远程监督是关系抽取任务中常用的数据自动标注方法,然而该方法会引入大量的噪声数据,从而影响模型的表现效果。为了解决噪声数据的问题,提出一种基于负训练和迁移学习的关系抽取方法。首先通过负训练的方法训练一个噪声数据识别模型;然后根据样本的预测概率值对噪声数据进行过滤和重新标注;最后利用迁移学习的方法解决远程监督存在的域偏移问题,从而进一步提升模型预测的精确率和召回率。以唐卡文化为基础,构建了具有民族特色的关系抽取数据集。实验结果表明,所提方法的F1值达到91.67%,相较于SENT(Sentence level distant relation Extraction via Negative Training)方法,提升了3.95个百分点,并且远高于基于BERT(Bidirectional Encoder RepresentationsfromTransformers)、BiLSTM+ATT(Bi-directionalLongShort-TermMemoryAndAttention)、PCNN(Piecewise Convolutional Neural Network)的关系抽取方法。
|
关 键 词: | 远程监督 负训练 知识图谱 关系抽取 迁移学习 自然语言处理 |
|