首页 | 本学科首页   官方微博 | 高级检索  
     

融合机器阅读理解的中文医学命名实体识别方法
引用本文:罗媛媛,杨春明,李波,张晖,赵旭剑.融合机器阅读理解的中文医学命名实体识别方法[J].计算机科学,2023(9):287-294.
作者姓名:罗媛媛  杨春明  李波  张晖  赵旭剑
作者单位:1. 西南科技大学计算机科学与技术学院;2. 四川省大数据与智能系统工程技术研究中心;3. 西南科技大学数理学院
摘    要:医学命名实体识别是自动构建大规模医学知识库的关键,但医学文本中存在实体嵌套现象,采用序列标注的方法不能识别出嵌套中的实体。文中提出了基于阅读理解框架的中文医学命名实体识别方法,该方法将嵌套命名实体识别问题建模为机器阅读理解问题,使用BERT建立阅读理解问题和医学文本之间的联系,并引入多头注意力机制强化问题和嵌套实体之间的语义联系,最后用两个分类器对实体开头和结尾位置进行预测。与目前5种主流方法相比,该方法取得了最优结果,综合F1值达到了67.65%;与经典的实体识别模型BiLSTM-CRF相比,F1值提升了7.17%,其中嵌套较多的临床表现实体提升16.81%。

关 键 词:命名实体识别  中文医学  嵌套实体  机器阅读理解  多头注意力机制
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号