首页 | 本学科首页   官方微博 | 高级检索  
     

部首感知的中文医疗命名实体识别
引用本文:李丹,徐童,郑毅,王喆锋,陈恩红.部首感知的中文医疗命名实体识别[J].中文信息学报,2021,34(12):54-64.
作者姓名:李丹  徐童  郑毅  王喆锋  陈恩红
作者单位:1.大数据分析与应用安徽省重点实验室(中国科学技术大学),安徽 合肥 230027;
2.中国科学技术大学 计算机科学与技术学院,安徽 合肥 230027;
3.华为技术有限公司,浙江 杭州 310052
基金项目:国家重点研发计划(2018YFB1004300);国家自然科学基金(U1605251,61703386);中央高校基本科研业务费专项资金(WK9110000014);安徽省重点研发计划项目(1804b06020377)
摘    要:人工智能技术的发展推动了医疗领域的智能化,为提升医疗效率、改善医疗水平提供了新的助力。同时,这一新的趋势也催生了海量的电子病历文本,其所蕴含的丰富信息具有巨大的潜在挖掘与应用价值。然而,当前中文电子病历的命名实体识别研究工作并没有全面考虑中文及中文医疗领域的特殊性,而是将面向通用数据集的模型迁移到医疗领域的实体类型中,分析效果较为有限。针对这一问题,该文设计了长短期记忆网络与条件随机场的联合模型并引入BERT模型;在此基础之上,考虑到医疗领域命名实体鲜明的部首特征,通过将部首信息编码到字向量中,并且结合部首信息修改条件随机场层得分函数的计算方式,有效地提升了医疗领域命名实体的抽取能力。通过两项电子病历数据集的实验结果表明,该文提出的模型整体效果略高于通用的实体识别模型,并对疾病诊断等特定类型的实体词的识别效果具有较为明显的提升。

关 键 词:命名实体识别  长短期记忆网络  条件随机场  BERT  

Radical-Aware Named Entity Recognition for Chinese Medical Records
LI Dan,XU Tong,ZHENG Yi,WANG Zhefeng,CHEN Enhong.Radical-Aware Named Entity Recognition for Chinese Medical Records[J].Journal of Chinese Information Processing,2021,34(12):54-64.
Authors:LI Dan  XU Tong  ZHENG Yi  WANG Zhefeng  CHEN Enhong
Affiliation:1.Anhui Province Key Laboratory of Big Data Analysis and Application, University of Science and Technology of China, Hefei, Anhui 230027, China;
2.School of Computer Science and Technology, University of Science and Technology of China, Hefei, Anhui 230027, China;
3.Huawei Technologies Co.Ltd, Hangzhou, Zhejiang 310052, China
Abstract:The general named entity recognition fails to capture the features in Chinese characters as well as Chinese medical records. In this paper, we integrate the BERT into a joint model of bi-directional long short-term memory and conditional random fields for better performance. Considering the unique feature of radicals for medical entities, we encode the radical information into the word vector, and then modify the scoring function of the CRF layer. Experiments on two real-world electronic medical record datasets validate that the proposed method outperforms the state-of-the-art baseline methods, especially for the disease-related named entities.
Keywords:named entity recognition  long short-term memory  conditional random field  BERT  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号