首页 | 本学科首页   官方微博 | 高级检索  
     

基于LEBERT-BCF的电子病历实体识别
作者姓名:吴广硕  樊重俊  陶国庆  贺远珍
作者单位:上海理工大学管理学院
基金项目:教育部哲学社会科学研究重大课题攻关项目(20JZD010);
摘    要:针对BERT在中文电子病历实体识别过程中缺少词信息,实体边界信息被浪费和模型鲁棒性较差等问题,提出一种基于BERT并引入外部词典进行特征增强和对抗训练的实体识别模型LEBERT-BCF。该模型通过外部词典自动为电子病历进行词汇匹配构建字符-词语对,在BERT内部将字符-词语对中对应字向量与词向量经过Lexicon Adapter模块进行特征融合并使用FGM提升模型的鲁棒性。在CCKS 2019数据集上的实验结果表明,该模型的F1值比BERTBiLSTM-CRF提高了3.45%。

关 键 词:BERT  特征增强  对抗训练  字符-词语对  鲁棒性
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号