首页 | 本学科首页   官方微博 | 高级检索  
     

融合文字与标签的电子病历命名实体识别
引用本文:赵奎,杜昕娉,高延军,马慧敏.融合文字与标签的电子病历命名实体识别[J].计算机系统应用,2022,31(10):375-381.
作者姓名:赵奎  杜昕娉  高延军  马慧敏
作者单位:中国科学院 沈阳计算技术研究所, 沈阳 110168;中国科学院大学, 北京 100049;中国医科大学附属第四医院, 沈阳 110032;东软集团股份有限公司 医疗解决方案事业本部, 沈阳 110003
基金项目:国家水体污染控制与治理科技重大专项(2018ZX07601001)
摘    要:准确的命名实体识别是结构化电子病历的基础, 对于电子病历规范化编写有着重要的作用, 而现今的分词工具对于专业的医疗术语无法做到完全正确的区分, 使得结构化电子病历难以实现. 针对医疗实体识别中出现的问题, 本文提出了一种在命名实体识别领域中改进的BiLSTM-CRF深度学习模型. 模型将文字和标签结合作为输入, 在多头注意力机制中使模型关注更多的有用信息, BiLSTM对输入进行特征提取, 得到每个文字在所有标签上的概率, CRF在训练过程中学习到数据集中的约束, 进行解码时可以提高结果的准确率. 实验使用人工标注的1000份电子病历作为数据集, 使用BIO标注方式. 从测试集的结果来看, 相对于传统的BiLSTM-CRF模型, 该模型在实体类别上的F1值提升了3%–11%, 验证了该模型在医疗命名实体识别中的有效性.

关 键 词:结构化电子病历  命名实体识别  BiLSTM  CRF  深度学习
收稿时间:2022/1/10 0:00:00
修稿时间:2022/1/30 0:00:00

Named Entity Recognition of Electronic Medical Records Based on Texts and Labels
ZHAO Kui,DU Xin-Ping,GAO Yan-Jun,MA Hui-Min.Named Entity Recognition of Electronic Medical Records Based on Texts and Labels[J].Computer Systems& Applications,2022,31(10):375-381.
Authors:ZHAO Kui  DU Xin-Ping  GAO Yan-Jun  MA Hui-Min
Affiliation:Shenyang Institute of Computing Technology, Chinese Academy of Sciences, Shenyang 110168, China;University of Chinese Academy of Sciences, Beijing 100049, China;The Fourth Affiliated Hospital of China Medical University, Shenyang 110032, China; Medical Solutions Business Division, Neusoft Group Co. Ltd., Shenyang 110003, China
Abstract:
Keywords:structured electronic medical record  named entity recognition  BiLSTM  CRF  deep learning
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号