基于CRF和规则的中文医疗机构名称识别 |
| |
引用本文: | 张金龙,王,石,钱存发.基于CRF和规则的中文医疗机构名称识别[J].计算机应用与软件,2014(3):159-162,198. |
| |
作者姓名: | 张金龙 王 石 钱存发 |
| |
作者单位: | ;1.江苏科技大学计算机科学与工程学院;2.中国科学院计算技术研究所 |
| |
摘 要: | 中文机构名称识别是中文自然语言处理的一项重要的研究课题。以中文医疗机构名识别为目标,从因特网上抓取了30余万条机构名和1 500篇包含医疗机构名的文本语料,对医疗机构名的组成特点和上下文信息进行详细的分析,总结出若干模式、规则和特征,最后结合条件随机场模型,建立了一个统计和规则相结合的中文医疗机构名识别模型。实验结果表明,该模型的识别效果很好。
|
关 键 词: | 中文机构名识别 条件随机场 命名实体识别 自然语言处理 |
CRF AND RULES-BASED RECOGNITION OF MEDICAL INSTITUTIONS NAME IN CHINESE |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 等数据库收录! |
|