首页 | 本学科首页   官方微博 | 高级检索  
     

基于最大熵模型的中文姓名识别
作者姓名:贾宁  张全
作者单位:1. 中国科学院研究生院,北京,100039;中国科学院声学研究所,北京,100080
2. 中国科学院声学研究所,北京,100080
基金项目:国家重点基础研究发展计划(973计划) , 中国科学院声学研究所创新资助项目
摘    要:最大熵模型可以对非常广泛的自然语言现象建立概率模型,该文提出了一种使用统计模型的中文姓名识别方法,采用最大熵原则建立统计模型,并运用该模型计算姓名概率。系统采用真实语料进行开放测试的结果表明,在保证一定准确率的情况下,系统召回率可达90%以上。

关 键 词:中文姓名识别  最大熵  特征函数
文章编号:1000-3428(2007)09-0031-03
修稿时间:2006-05-10
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号