排序方式: 共有3条查询结果,搜索用时 0 毫秒
1
1.
由于没有完整可用的指标同义词库以进行指标映射,各家医院关于同一检验检查指标的不同称谓,已严重影响到了区域间医疗信息的互联共享,因而需要对检验检查指标进行标准化处理.这可以看作是一个实体对齐问题,但指标只有相应的取值和取值范围,难以像知识库实例匹配那般使用到属性信息,也不似实体链接那般拥有上下文信息,而且不存在一个标准知识库来提供所有指标的标准名称.针对以上问题,提出指标标准化算法,先根据指标字面特征进行聚类,再使用相似度特征和分块打分特征迭代地进行二分类映射.实验表明,最终的二分类映射,其F1-score可以达到85.27%,证明了该方法的有效性. 相似文献
2.
国家卫计委要求医疗机构使用国际疾病分类(international classification of diseases, ICD)编码,然而由于临床疾病描述存在大量的常用词,导致电子病历中录入的诊断名称与ICD编码直接映射匹配率低.基于区域健康平台上的真实诊断数据,构建了融合常用语的疾病术语图谱.具体来说,在基于疾病构成成分的规则算法基础上,提出了基于数据增强的BERT(bidirectional encoder representation from transformers)上下位关系识别算法,将5万多个诊断常用语和ICD10(international classification of diseases 10th revision,Chinese version)中的疾病进行同义关系和上下位关系识别,进一步融合了ICD11(international classification of diseases 11th revision,Chinese version)的层次结构,此外,还提出了基于疾病-科室关联图谱的任务分配方法以进行人工校验,最终94 478个疾病实体形成了包含1 460条同义关系、46 508条上下位关系的大规模疾病术语图谱.评估实验表明,基于疾病术语图谱,对临床诊断数据的覆盖率比基于ICD10的直接映射编码的覆盖率提升了75.31%,另外,利用疾病术语图谱自动进行编码疾病相比于医生人工编码会缩短约59.75%的编码时间,且正确率达到85%.
相似文献
相似文献
3.
由于上海市区域医疗健康平台整合了38家三级医院的电子病历,各医院表述同一临床检验指标的多样性和歧义性已严重影响病历挖掘研究。然而现有术语库理论性强,难以覆盖实际临床用语,需要构建融合38家医院的临床检验指标术语库。针对该问题,在模式图定义、知识抽取、知识融合和知识校验4个步骤基础上,提出半自动的术语库构建方案,以上海卫健委制定的医保术语为标准,先构建标准指标术语子库,再利用基于BERT的临床检验指标对齐模型,将38家医院的指标作为同义词归入标准术语。最终形成的指标术语库包含23 495个实体和47 746条事实三元组,可用于病历清洗、病历查询等应用。实验表明,所用指标对齐模型的F1-score可达95.78%,在大肠癌挖掘课题中使用术语库可增加查询记录高达94%。此外,大肠癌相关指标的专病术语库已在dcakb.ecustnlplab.com公开。 相似文献
1