面向中文电子病历的属性挖掘 |
| |
引用本文: | 费超群,张书涵,李阳阳.面向中文电子病历的属性挖掘[J].高技术通讯,2022(6):597-606. |
| |
作者姓名: | 费超群 张书涵 李阳阳 |
| |
作者单位: | 1. 智能信息处理重点实验室;2. 中国科学院计算技术研究所;3. 中国科学院大学;4. 管理、决策与信息系统重点实验室;5. 中国科学院数学与系统科学研究院 |
| |
摘 要: | 电子病历(EMR)的属性挖掘任务旨在从一组同一科室下的病历文本中抽取该科室医学检查项目。传统的频繁项或序列挖掘技术并不能直接用于该任务。本文提出一种新的不需要人工干预的属性挖掘框架,并借助无标注技术来处理这一难题,即将属性挖掘问题形式化为半结构化的频繁子序列挖掘任务,并提出一种有效的算法从电子病历中挖掘候选的词模式。在中文电子病历上进行的各项综合实验,证明了本文提出的方法可以有效处理属性挖掘任务。
|
关 键 词: | 属性挖掘 电子病历(EMR) 频繁子序列挖掘 词模式 频繁词模式 |
|
|