首页 | 本学科首页   官方微博 | 高级检索  
     

中文电子病历命名实体标注语料库构建
引用本文:曲春燕,关毅,杨锦锋,赵永杰,刘雅欣.中文电子病历命名实体标注语料库构建[J].高技术通讯,2015,25(2).
作者姓名:曲春燕  关毅  杨锦锋  赵永杰  刘雅欣
作者单位:1. 哈尔滨工业大学计算机科学与技术学院 哈尔滨150001
2. 哈尔滨医科大学附属第四医院 哈尔滨150001
3. 哈尔滨医科大学附属第二医院 哈尔滨150001
摘    要:针对中文电子病历命名实体语料标注空白的现状,研究了中文电子病历命名实体标注语料库的构建。参考2010年美国国家集成生物与临床信息学研究中心(1282)给出的电子病历命名实体类型及修饰类型的定义,在专业医生的指导下制定了详尽的中文电子病历标注规范;通过对大量中文电子病历的分析,提出了一套完整的中文电子病历命名实体标注方案,而且采用预标注和正式标注的方法,建立了一定规模的中文电子病历命名实体标注语料库,其标注语料的一致性达到了92%以上。该工作对中文电子病历的命名实体识别及信息抽取研究提供了可靠的数据支持,对医疗知识挖掘也有重要意义。

关 键 词:中文电子病历(CEMR)  命名实体  标注语料库  标注规范  标注一致性(IAA)

The construction of annotated corpora of named entities for Chinese electronic medical records
Qu Chunyan,Guan Yi,Yang Jinfeng,Zhao Yongjie,Liu Yaxin.The construction of annotated corpora of named entities for Chinese electronic medical records[J].High Technology Letters,2015,25(2).
Authors:Qu Chunyan  Guan Yi  Yang Jinfeng  Zhao Yongjie  Liu Yaxin
Abstract:
Keywords:Chinese electronic medical record(CEMR)  named entity  annotated corpus  annotation specification  inter-annotator agreement (IAA)
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号