首页 | 本学科首页   官方微博 | 高级检索  
     

基于统计的中文姓名识别方法研究
引用本文:张锋,樊孝忠,许云.基于统计的中文姓名识别方法研究[J].计算机工程与应用,2004,40(10):53-54,77.
作者姓名:张锋  樊孝忠  许云
作者单位:北京理工大学计算机科学工程系,北京,100081
摘    要:该文在大规模标注语料的基础上统计分析了中文姓名前置词频率、中文姓氏用字频率、中文名字用字频率、中文姓名后置词频率。利用这些统计数据在词语粗分的基础上实现了中文姓名的自动识别,实验测试结果:准确率93.82%、召回率89.37%。

关 键 词:自动分词  未登录词  中文姓名识别
文章编号:1002-8331-(2004)10-0053-02

The Research of Chinese Names Recognition Method Based on Statistics
Zhang Feng Fan Xiaozhong Xu,Yun.The Research of Chinese Names Recognition Method Based on Statistics[J].Computer Engineering and Applications,2004,40(10):53-54,77.
Authors:Zhang Feng Fan Xiaozhong Xu  Yun
Abstract:This paper prsents a method about Chinese names automatic recognition by analyzing usage frequency of word before Chinese name ,Chinese surname ,Chinese firstname and the word after Chinese name on the basis of large scale corpus.After test,the recall rate and precision rate are respectively93.82%and89.37%.
Keywords:automatic segmentation  out-of-dictionary word  Chinese names recognition
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号