首页 | 本学科首页   官方微博 | 高级检索  
     

基于最大熵模型的中文姓名识别
引用本文:贾宁,张全.基于最大熵模型的中文姓名识别[J].计算机工程,2007,33(9):31-33.
作者姓名:贾宁  张全
作者单位:1. 中国科学院研究生院,北京,100039;中国科学院声学研究所,北京,100080
2. 中国科学院声学研究所,北京,100080
基金项目:国家重点基础研究发展计划(973计划) , 中国科学院声学研究所创新资助项目
摘    要:最大熵模型可以对非常广泛的自然语言现象建立概率模型,该文提出了一种使用统计模型的中文姓名识别方法,采用最大熵原则建立统计模型,并运用该模型计算姓名概率。系统采用真实语料进行开放测试的结果表明,在保证一定准确率的情况下,系统召回率可达90%以上。

关 键 词:中文姓名识别  最大熵  特征函数
文章编号:1000-3428(2007)09-0031-03
修稿时间:2006-05-10

Identification of Chinese Names Based on Maximum Entropy Model
JIA Ning,ZHANG Quan.Identification of Chinese Names Based on Maximum Entropy Model[J].Computer Engineering,2007,33(9):31-33.
Authors:JIA Ning  ZHANG Quan
Affiliation:1. Graduate School, Chinese Academy of Sciences, Beijing 100039;2. Institute of Acoustics, Chinese Academy of Sciences, Beijing 100080
Abstract:Maximum entropy model can be used to found probability model of many natural language problem. This paper presents an approach for Chinese name recognition based on statistic model. It founds the model with maximum entropy principle, and calculates name probability by the model. It gets good recalling rates and precision by open test on actual corpus. The method is practicable.
Keywords:Chinese name recognition  Maximum entropy  Feature function
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号