首页 | 本学科首页   官方微博 | 高级检索  
     

结合实体边界线索的中文命名实体识别方法
引用本文:黄蓉,陈艳平,扈应,黄瑞章,秦永彬.结合实体边界线索的中文命名实体识别方法[J].计算机工程与应用,2024(6):199-206.
作者姓名:黄蓉  陈艳平  扈应  黄瑞章  秦永彬
作者单位:1. 贵州大学公共大数据国家重点实验室;2. 贵州大学计算机科学与技术学院
基金项目:国家自然科学基金(62166007);
摘    要:命名实体识别作为信息抽取领域的一个基础任务,能为机器翻译、关系抽取等下游任务提供有效支撑,具有重要的研究意义。针对中文命名实体识别方法中存在的实体边界模糊的问题,提出了一种结合实体边界线索的命名实体识别模型,模型由边界检测、线索生成、实体分类三个模块组成。利用边界检测模块识别实体边界。在线索生成模块中依据边界信息生成实体跨度,得到带边界线索标签的文本序列,使模型通过边界线索标签感知句子中的实体边界,学习实体边界和上下文的语义依赖特征。将带有边界线索标签的文本序列作为实体分类模块的输入,使用双仿射机制增强标签之间的语义交互,并结合双仿射机制与多层感知机的共同预测作为实体识别的结果。该模型在ACE2005中文数据集和Weibo数据集上的F1值分别达到了90.47%和73.54%,验证了模型对中文命名实体识别的有效性。

关 键 词:命名实体识别  嵌套命名实体识别  线索标签  边界检测
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号