基于预训练语言模型的中文地址命名实体识别 |
| |
作者姓名: | 李廷元 杨勇 |
| |
作者单位: | 中国民用航空飞行学院计算机学院 |
| |
摘 要: | 随着深度学习的发展,基于深度学习的命名实体识别抽取过程中,作为基础步骤的预训练模型也愈发受到重视。中文预训练语言模型能够更好地结合语义语境,更加充分地考虑到一词多义的情况,因此该语言模型目前也普遍应用于命名实体识别任务。文中首先介绍了BERT、ERNIE、NEZHA三种预训练模型,之后构建预训练模型、BiGRU及CRF的算法模型,在阿里中文地址要素解析比赛数据集上进行中文地址命名实体识别任务。实验结果表明,NEZHA取得当前预训练语言模型最优的识别结果。
|
关 键 词: | 预训练模型 命名实体识别 深度学习 中文地址 |
|
|