首页 | 本学科首页   官方微博 | 高级检索  
     

病理镜检文本数据的结构化处理方法
引用本文:陈德华,刘茜茜,乐嘉锦,潘 乔,朱立峰.病理镜检文本数据的结构化处理方法[J].计算机与现代化,2016,0(4):1.
作者姓名:陈德华  刘茜茜  乐嘉锦  潘 乔  朱立峰
基金项目:上海市科委科技创新行动计划资助项目(15511106900)
摘    要:目前医疗文本数据的结构化处理大多依赖通用分词工具或医学知识库,而通用分词工具对专业术语的识别效果并不理想,且国内的中文医学术语标准化进程不足。针对此问题,提出一种基于统计信息对镜检文本数据进行结构化处理的方法。该方法以聚类文本为基础,基于断点词与重合串分词,利用分词词串的统计信息获取关键词以及词语类别信息,并进行词语扩充,从而得到最终词库作为字典。利用基于字典的双向最大匹配分词算法,对文本数据进行分词,并通过添加否定检出的规则,获取结构化数据。实验结果表明,该方法获取的医学词库的准确率达到了80%,实现了不依赖分词工具获得结构化数据的功能。

关 键 词:医疗文本数据    文本数据结构化    统计    分词    双向最大匹配  
收稿时间:2018-09-30

Structured Approach for Pathological Microscopy Text
CHEN De-hua,LIU Xi-xi,LE Jia-jin,PAN Qiao,ZHU Li-feng.Structured Approach for Pathological Microscopy Text[J].Computer and Modernization,2016,0(4):1.
Authors:CHEN De-hua  LIU Xi-xi  LE Jia-jin  PAN Qiao  ZHU Li-feng
Abstract:
Keywords:medical text data  structuring text data  statistics  word segmentation  two-way maximum matching  
点击此处可从《计算机与现代化》浏览原始摘要信息
点击此处可从《计算机与现代化》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号