首页 | 本学科首页   官方微博 | 高级检索  
     

基于负训练和迁移学习的关系抽取方法
引用本文:陈克正,郭晓然,钟勇,李振平.基于负训练和迁移学习的关系抽取方法[J].计算机应用,2023(8):2426-2430.
作者姓名:陈克正  郭晓然  钟勇  李振平
作者单位:1. 中国科学院成都计算机应用研究所;2. 中国科学院大学计算机科学与技术学院;3. 西北民族大学数学与计算机科学学院
基金项目:中央高校基本科研业务费(青年教师创新)项目(31920210090)~~;
摘    要:远程监督是关系抽取任务中常用的数据自动标注方法,然而该方法会引入大量的噪声数据,从而影响模型的表现效果。为了解决噪声数据的问题,提出一种基于负训练和迁移学习的关系抽取方法。首先通过负训练的方法训练一个噪声数据识别模型;然后根据样本的预测概率值对噪声数据进行过滤和重新标注;最后利用迁移学习的方法解决远程监督存在的域偏移问题,从而进一步提升模型预测的精确率和召回率。以唐卡文化为基础,构建了具有民族特色的关系抽取数据集。实验结果表明,所提方法的F1值达到91.67%,相较于SENT(Sentence level distant relation Extraction via Negative Training)方法,提升了3.95个百分点,并且远高于基于BERT(Bidirectional Encoder RepresentationsfromTransformers)、BiLSTM+ATT(Bi-directionalLongShort-TermMemoryAndAttention)、PCNN(Piecewise Convolutional Neural Network)的关系抽取方法。

关 键 词:远程监督  负训练  知识图谱  关系抽取  迁移学习  自然语言处理
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号