基于最大熵模型的中文姓名识别 |
| |
作者姓名: | 贾宁 张全 |
| |
作者单位: | 1. 中国科学院研究生院,北京,100039;中国科学院声学研究所,北京,100080 2. 中国科学院声学研究所,北京,100080 |
| |
基金项目: | 国家重点基础研究发展计划(973计划)
,
中国科学院声学研究所创新资助项目 |
| |
摘 要: | 最大熵模型可以对非常广泛的自然语言现象建立概率模型,该文提出了一种使用统计模型的中文姓名识别方法,采用最大熵原则建立统计模型,并运用该模型计算姓名概率。系统采用真实语料进行开放测试的结果表明,在保证一定准确率的情况下,系统召回率可达90%以上。
|
关 键 词: | 中文姓名识别 最大熵 特征函数 |
文章编号: | 1000-3428(2007)09-0031-03 |
修稿时间: | 2006-05-10 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机工程》浏览原始摘要信息 |
|
点击此处可从《计算机工程》下载全文 |
|