结合实体标签的中文嵌套命名实体识别 |
| |
作者姓名: | 潘丽君 陈艳平 黄瑞章 秦永彬 |
| |
作者单位: | 1. 贵州大学计算机科学与技术学院;2. 贵州大学贵州省公共大数据重点实验室 |
| |
基金项目: | 国家自然科学基金项目(编号:62166007)资助; |
| |
摘 要: | 针对嵌套命名实体识别,神经网络模型中提出基于跨度的框架。该框架首先产生跨度种子,然后搭建分类器进行筛选。但单独对跨度区域进行分类存在丢失全局语义信息的问题。另外,在中文嵌套命名实体识别中,因为缺少分隔符且中文高度依赖上下文,跨度区域无法有效使用词边界特征,导致识别性能不佳。为解决上述问题,本文提出结合实体标签的中文嵌套命名实体识别模型(CEL)。该模型生成跨度种子后,在原句子的跨度区域开始及结束位置嵌入实体标签,再作为分类器输入,从而更好地学习到跨度种区域边界和上下文之间的语义依赖特征。论文在ACE2005中文数据集上进行实验,实验表明,CEL模型在F1值上达到了较好水平。
|
关 键 词: | 嵌套命名实体识别 神经网络 跨度种子 全局语义信息 实体标签 |
|