首页 | 本学科首页   官方微博 | 高级检索  
     

基于统计方法的中文姓名识别
引用本文:刘秉伟,黄萱菁,郭以昆,吴立德. 基于统计方法的中文姓名识别[J]. 中文信息学报, 2000, 14(3): 16-24,36
作者姓名:刘秉伟  黄萱菁  郭以昆  吴立德
作者单位:复旦大学计算机科学系
基金项目:本项研究受上海市教委重点学科基金、国家自然科学基金、日本富士通公司资助
摘    要:本文介绍一个中文姓名的自动识别系统,该系统使用从姓名样本库和真实文本语料库中得到的大量统计数据,以提高系统识别性能。我们从1994年人民日报中随机抽取100篇文章作为测试样本,实验结果表明,准确率和召回率可同时达到90%以上。

关 键 词:自动分词  未登录词  中文姓名识别  

Statistical Chinese Person Names Identification
Liu Bingwei Huang Xuanjing Guo Yikun Wu Lide Dept.of Computer Science,Fudan University Shanghai. Statistical Chinese Person Names Identification[J]. Journal of Chinese Information Processing, 2000, 14(3): 16-24,36
Authors:Liu Bingwei Huang Xuanjing Guo Yikun Wu Lide Dept.of Computer Science  Fudan University Shanghai
Affiliation:Dept. of Computer Science , Fudan University
Abstract:This paper presents an automatic identifying system of Chinese names.The system makes use of a large amount of statistical data,which are extracted from real name library and real text corpus,to enhance its identifying performance.The testing sample,including 100 articles,are extracted from the People's Daily 1994 News Corpus.The experiment shows that the recall and the precision can both reach above 90%.
Keywords:Automatic word segmentation Out of dictionary word Chinese person names identification
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号