结合实体边界线索的中文命名实体识别方法 |
| |
引用本文: | 黄蓉,陈艳平,扈应,黄瑞章,秦永彬.结合实体边界线索的中文命名实体识别方法[J].计算机工程与应用,2024(6):199-206. |
| |
作者姓名: | 黄蓉 陈艳平 扈应 黄瑞章 秦永彬 |
| |
作者单位: | 1. 贵州大学公共大数据国家重点实验室;2. 贵州大学计算机科学与技术学院 |
| |
基金项目: | 国家自然科学基金(62166007); |
| |
摘 要: | 命名实体识别作为信息抽取领域的一个基础任务,能为机器翻译、关系抽取等下游任务提供有效支撑,具有重要的研究意义。针对中文命名实体识别方法中存在的实体边界模糊的问题,提出了一种结合实体边界线索的命名实体识别模型,模型由边界检测、线索生成、实体分类三个模块组成。利用边界检测模块识别实体边界。在线索生成模块中依据边界信息生成实体跨度,得到带边界线索标签的文本序列,使模型通过边界线索标签感知句子中的实体边界,学习实体边界和上下文的语义依赖特征。将带有边界线索标签的文本序列作为实体分类模块的输入,使用双仿射机制增强标签之间的语义交互,并结合双仿射机制与多层感知机的共同预测作为实体识别的结果。该模型在ACE2005中文数据集和Weibo数据集上的F1值分别达到了90.47%和73.54%,验证了模型对中文命名实体识别的有效性。
|
关 键 词: | 命名实体识别 嵌套命名实体识别 线索标签 边界检测 |
|
|