首页 | 本学科首页   官方微博 | 高级检索  
     

基于角色标注的中国人名自动识别研究
引用本文:张华平,刘群.基于角色标注的中国人名自动识别研究[J].计算机学报,2004,27(1):85-91.
作者姓名:张华平  刘群
作者单位:1. 中国科学院计算技术研究所,北京,100080;中国科学院研究生院,北京,100080
2. 中国科学院计算技术研究所,北京,100080;北京大学信息学院计算机科学与技术系计算语言研究所,北京,100871
基金项目:国家“九七三”重点基础研究发展规划项目(G19980 3 0 5 0 7 4,G19980 3 0 5 10 ),中国科学院计算技术研究所领域前沿青年基金项目 (20 0 2 6180 2 3 )资助
摘    要:该文提出了一种基于角色标注的中国人名自动识别方法。其基本思想是:根据在人名识别中的作用,采取Viterbi算法对切词结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别。识别过程中只需要将某个词作为特定角色的概率以及角色之间的转移概率。该方法的实用性还在于:这些角色信息完全可以从真实语料库中自动抽取得到。通过对16M字节真实语料库的封闭与开放测试,该方法取得了接近98%的召回率。文中介绍了计算所汉语词法分析系统ICTCLAS,集成人名识别算法之后,词法分析的准确率提高了1.41%,同时人名识别的综合指标F-1值达到了95.40%。不同实验从各个角度表明:基于角色标注的人名识别算法行之有效。

关 键 词:中文自然语言处理  词法分析  角色标注  自动识别  角色序列  Viterbi算法  中国人名

Automatic Recognition of Chinese Personal Name Based on Role Tagging
ZHANG Hua Ping , LIU Qun ,.Automatic Recognition of Chinese Personal Name Based on Role Tagging[J].Chinese Journal of Computers,2004,27(1):85-91.
Authors:ZHANG Hua Ping  LIU Qun  
Affiliation:ZHANG Hua Ping 1),2) LIU Qun 1),3) 1)
Abstract:
Keywords:Chinese personal name recognition  unknown words recognition  role tagging  Viterbi algorithm  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号