基于知识增强的命名实体识别方法研究 |
| |
作者姓名: | 高翔 唐积强 朱俊武 梁明轩 李阳 |
| |
作者单位: | 1. 扬州大学信息工程学院;2. 中国科学院计算技术研究所;3. 国家计算机网络应急技术处理协调中心 |
| |
基金项目: | 北京市科技新星计划交叉学科合作课题(Z191100001119014);;国家重点研发计划重点专项(2017YFC1700300,2017YFB1002300);;国家自然科学基金(61702234)~~; |
| |
摘 要: | 命名实体识别作为自然语言处理中一项十分基础的任务,其目的是从一段用自然语言描述的文本中识别出相应的实体及类型。知识图谱作为以三元组形式存在的外部知识,已经在很多自然语言处理任务中得以应用并取得了良好效果。文中提出了一种基于知识图谱信息增强的注意力对齐命名实体识别方法,首先通过嵌入层和注意力机制嵌入知识图谱信息,获取知识图谱三元组信息的表示;其次通过BERT-BiLSTM获取句子的上下文表示;然后通过一种注意力对齐模块分配三元组权重融合知识图谱信息与句子信息的表示;最后通过softmax控制融合后的表示向量的预测输出,进而获取实体的标签。该方法有效避免了因知识图谱的融合而改变原句子的语义信息,同时也使得句子中的词向量具有丰富的外部知识。所提方法在中文通用数据集MSRA和医疗领域专用数据集Medicine上的F1值分别达到了95.73%和93.80%,相比基线模型提升了1.21%和1.3%。
|
关 键 词: | 命名实体识别 知识图谱增强 注意力机制 深度学习 |
|
|