首页 | 本学科首页   官方微博 | 高级检索  
     

融合常用语的大规模疾病术语图谱构建
引用本文:张晨童,张佳影,张知行,阮彤,何萍,葛小玲.融合常用语的大规模疾病术语图谱构建[J].计算机研究与发展,2020,57(11):2467-2477.
作者姓名:张晨童  张佳影  张知行  阮彤  何萍  葛小玲
作者单位:1.1(华东理工大学  上海  200237);2.2(上海申康医院发展中心  上海  200041);3.3(复旦大学附属儿科医院  上海  201108)  (chentong_zhang@163.com)
基金项目:国家重点研发计划;国家自然科学基金
摘    要:国家卫计委要求医疗机构使用国际疾病分类(international classification of diseases, ICD)编码,然而由于临床疾病描述存在大量的常用词,导致电子病历中录入的诊断名称与ICD编码直接映射匹配率低.基于区域健康平台上的真实诊断数据,构建了融合常用语的疾病术语图谱.具体来说,在基于疾病构成成分的规则算法基础上,提出了基于数据增强的BERT(bidirectional encoder representation from transformers)上下位关系识别算法,将5万多个诊断常用语和ICD10(international classification of diseases 10th revision,Chinese version)中的疾病进行同义关系和上下位关系识别,进一步融合了ICD11(international classification of diseases 11th revision,Chinese version)的层次结构,此外,还提出了基于疾病-科室关联图谱的任务分配方法以进行人工校验,最终94 478个疾病实体形成了包含1 460条同义关系、46 508条上下位关系的大规模疾病术语图谱.评估实验表明,基于疾病术语图谱,对临床诊断数据的覆盖率比基于ICD10的直接映射编码的覆盖率提升了75.31%,另外,利用疾病术语图谱自动进行编码疾病相比于医生人工编码会缩短约59.75%的编码时间,且正确率达到85%.


关 键 词:常用语  疾病术语图谱  国际疾病分类  关系识别  校验

Construction of Large-Scale Disease Terminology Graph with Common Terms
Zhang Chentong,Zhang Jiaying,Zhang Zhixing,Ruan Tong,He Ping,Ge Xiaoling.Construction of Large-Scale Disease Terminology Graph with Common Terms[J].Journal of Computer Research and Development,2020,57(11):2467-2477.
Authors:Zhang Chentong  Zhang Jiaying  Zhang Zhixing  Ruan Tong  He Ping  Ge Xiaoling
Affiliation:1.1(East China University of Science and Technology, Shanghai 200237);2.2(Shanghai Hospital Development Center, Shanghai 200041);3.3(Children’s Hospital of Fudan University, Shanghai 201108)
Abstract:
Keywords:common terms  disease terminology graph  ICD(international classification of diseases)  relationship recognition  verification
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机研究与发展》浏览原始摘要信息
点击此处可从《计算机研究与发展》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号