首页 | 本学科首页   官方微博 | 高级检索  
     

基于语义相关性的命名实体识别算法研究
引用本文:袁运新,樊腾飞,聂为之.基于语义相关性的命名实体识别算法研究[J].中文信息学报,2023(10):34-44.
作者姓名:袁运新  樊腾飞  聂为之
作者单位:1. 天津大学电气自动化与信息工程学院;2. 天津大学国际工程师学院
基金项目:国家重点研究与发展计划(2020YFB1711704);;国家自然科学基金(62272337);
摘    要:高质量的命名实体识别算法往往依赖海量的高质量标注数据来帮助实体识别模型的训练,然而大规模标注数据的获取存在诸多困难,如何通过文本信息自身的相关性来提高实体识别的准确性受到越来越多科研工作者的关注。该文有效地利用文本信息的语义相关性引入“实体联合器”概念,通过其与实体的高相关性,提高实体的数字化表征能力,进而实现对实体的有效识别。基于此,首先提出了一种实体联合器识别模型,通过文本关联结构信息来实现非标签文本的实体联合器识别;之后,采用经典的BiLSTM网络模型,提取句子的语义表征,并利用特征融合机制实现实体联合器与句子特征融合;由于实体联合器与实体有较强的关联性,又提出了针对实体表征及句子整体表征的约束机制,确保实体联合器在特征学习过程中的指导作用,精准高效地识别文本数据中的实体。通过在公开的数据集CoNLL03、NCBI Disease上对该文算法进行测试,相关实验结果证明了该文所提出算法的优越性和合理性。

关 键 词:命名实体识别  语义相关性  实体联合器
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号