融合机器阅读理解的中文医学命名实体识别方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

融合机器阅读理解的中文医学命名实体识别方法

引用本文：	罗媛媛,杨春明,李波,张晖,赵旭剑.融合机器阅读理解的中文医学命名实体识别方法[J].计算机科学,2023(9):287-294.

作者姓名：	罗媛媛杨春明李波张晖赵旭剑

作者单位：	1. 西南科技大学计算机科学与技术学院;2. 四川省大数据与智能系统工程技术研究中心;3. 西南科技大学数理学院

摘要：	医学命名实体识别是自动构建大规模医学知识库的关键，但医学文本中存在实体嵌套现象，采用序列标注的方法不能识别出嵌套中的实体。文中提出了基于阅读理解框架的中文医学命名实体识别方法，该方法将嵌套命名实体识别问题建模为机器阅读理解问题，使用BERT建立阅读理解问题和医学文本之间的联系，并引入多头注意力机制强化问题和嵌套实体之间的语义联系，最后用两个分类器对实体开头和结尾位置进行预测。与目前5种主流方法相比，该方法取得了最优结果，综合F1值达到了67.65%;与经典的实体识别模型BiLSTM-CRF相比，F1值提升了7.17%,其中嵌套较多的临床表现实体提升16.81%。
关键词：	命名实体识别中文医学嵌套实体机器阅读理解多头注意力机制