首页 | 本学科首页   官方微博 | 高级检索  
     

结合实体标签的中文嵌套命名实体识别
作者姓名:潘丽君  陈艳平  黄瑞章  秦永彬
作者单位:1. 贵州大学计算机科学与技术学院;2. 贵州大学贵州省公共大数据重点实验室
基金项目:国家自然科学基金项目(编号:62166007)资助;
摘    要:针对嵌套命名实体识别,神经网络模型中提出基于跨度的框架。该框架首先产生跨度种子,然后搭建分类器进行筛选。但单独对跨度区域进行分类存在丢失全局语义信息的问题。另外,在中文嵌套命名实体识别中,因为缺少分隔符且中文高度依赖上下文,跨度区域无法有效使用词边界特征,导致识别性能不佳。为解决上述问题,本文提出结合实体标签的中文嵌套命名实体识别模型(CEL)。该模型生成跨度种子后,在原句子的跨度区域开始及结束位置嵌入实体标签,再作为分类器输入,从而更好地学习到跨度种区域边界和上下文之间的语义依赖特征。论文在ACE2005中文数据集上进行实验,实验表明,CEL模型在F1值上达到了较好水平。

关 键 词:嵌套命名实体识别  神经网络  跨度种子  全局语义信息  实体标签
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号