中国组织机构名自动识别系统的设计与实现 |
| |
引用本文: | 张辉,徐健. 中国组织机构名自动识别系统的设计与实现[J]. 电脑开发与应用, 2002, 15(1): 5-6,9 |
| |
作者姓名: | 张辉 徐健 |
| |
作者单位: | 山西省疾病预防控制中心,太原,030012 |
| |
基金项目: | 国家社科重大项目 (97@YY0 1- 2 )资助 |
| |
摘 要: | 以搜狐网站的 2 0 0 0年 11~ 12月人民日报网页中涉及社会、经济、法律等内容的 5 0万汉字语料为基础 ,首先利用基于隐马尔可夫模型进行初识别 ,然后建立了一定规模的规则集 ,实现了中国组织机构名自动识别系统。经测试准确率达 89% ,召回率为 94 .5 %。
|
关 键 词: | 专有名词 组织机构名 自动识别 隐马尔可夫模型 |
Design and Implementation of Automatic Recognition Method System of Chinese Institution Terms |
| |
Abstract: | On the basis of 500 000 characters from the People Daily's frontpape of Nov~Dec,2000 in the www.Sohu.Com involving society,economy,law etc.and other contents,hidden Markov model is used to recognize Chinese Institution Terms in real text in this paper firstly.Then some rules have been set.Finally an automatic identification experiment system of Chinese Institution Terms has been designed and implemented.The results show that rates if recall and precision are 94.5% and 89% respectively. |
| |
Keywords: | special noun institution terms automatic identification hidden Markov model |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|