首页 | 官方网站   微博 | 高级检索  
     

基于最大熵模型的中国人名自动识别
引用本文:曹波,苏一丹,邓琦.基于最大熵模型的中国人名自动识别[J].计算机工程与应用,2009,45(4):227-228.
作者姓名:曹波  苏一丹  邓琦
作者单位:广西大学 计算机与电子信息学院,南宁 530004
摘    要:用最大熵模型自动识别中国人名。首先对语料库的词性进行角色替换,然后用特征模板从角色替换后的语料库中提取出特征集,接着用IIS算法训练特征集的最大熵参数,最后用viterbi算法对初分词文本进行角色标注,并在角色序列的基础上进行模式最大匹配,从而实现中国人名的自动识别。在封闭测试实验中,识别准确率、召回率、F-值分别达到了85.4%、91.2%、88.2%。

关 键 词:中国人名识别  最大熵模型  viterbi算法  
收稿时间:2008-1-4
修稿时间:2008-3-27  

Automatic recognition of Chinese name based on maximum entropy
CAO Bo,SU Yi-dan,DENG Qi.Automatic recognition of Chinese name based on maximum entropy[J].Computer Engineering and Applications,2009,45(4):227-228.
Authors:CAO Bo  SU Yi-dan  DENG Qi
Affiliation:School of Computer and Electronic Information,Guangxi University,Nanning 530004,China
Abstract:Authors use the maximum entropy model to recognize the Chinese name automatically.Firstly,authors replace the corpus's poses with roles,then,use feature template to extract feature set from the corpus which poses have been replaced with roles,thirdly,train the parameters of the feature set using IIS algorithm,finally,use the viterbi algorithm to tag the text which has been roughly segmented.The possible names are recognized after maximum pattern matching on the roles sequence.The closed test shows that the ...
Keywords:Chinese name recognition  maximum entropy model  viterbi algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号