首页 | 本学科首页   官方微博 | 高级检索  
     

基于神经网络的医疗文本分类研究
作者姓名:许浪  李代伟  张海清  唐聃  何磊  于曦
作者单位:1. 成都信息工程大学软件工程学院;2. 四川省信息化应用支撑软件工程技术研究中心;3. 成都大学斯特灵学院
基金项目:国家自然科学基金(61602604);
摘    要:传统的医学文本数据分类方法忽略了文本的上下文关系,每个词之间相互独立,无法表示语义信息,文本描述和分类效果差;并且特征工程需要人工干预,因此泛化能力不强。针对医疗文本数据分类效率低和精度低的问题,提出了一种基于Transformer双向编码器表示BERT、卷积神经网络CNN和双向长短期记忆BiLSTM神经网络的医学文本分类模型CMNN。该模型使用BERT训练词向量,结合CNN和BiLSTM,捕捉局部潜在特征和上下文信息。最后,将CMNN模型与传统的深度学习模型TextCNN和TextRNN在准确率、精确率、召回率和F1值方面进行了比较。实验结果表明,CMNN模型在所有评价指标上整体优于其他模型,准确率提高了1.69%~5.91%。

关 键 词:自然语言处理  医疗文本分类  BERT  CNN  BiLSTM
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号