首页 | 本学科首页   官方微博 | 高级检索  
     

基于类向量模型的中文姓名识别研究
引用本文:贾品贵,杨一平,卢朋.基于类向量模型的中文姓名识别研究[J].计算机应用研究,2007,24(4):111-113.
作者姓名:贾品贵  杨一平  卢朋
作者单位:中国科学院,自动化所,综合信息中心,北京,100080
摘    要:提出了一种基于类向量模型的中文姓名识别方法.该方法通过类向量的生成来模拟人工识别姓名的过程,采用Viterbi算法对未经切分的汉字串进行类向量标注得到类向量序列,通过检查相邻类向量中类别和向量分量的变化来最终识别出人名.该方法是完全数据驱动的,不需要姓名识别的模式和规则.通过对互联网上随机抽取的1 000篇文章进行测试,结果表明,中文姓名识别召回率为82.2%,准确率为70.3%.

关 键 词:中文姓名识别  类向量模型  Viterbi算法  基于汉字  向量模型  中文  姓名识别  研究  Model  Vector  Class  Based  Identification  Names  Chinese  准确率  召回率  结果  测试  随机抽取  互联网  规则  模式  数据驱动
文章编号:1001-3695(2007)04-0111-03
修稿时间:2005-12-31

Research of Chinese Names Identification Based on Class Vector Model
JIA Pin gui,YANG Yi ping,LU Peng.Research of Chinese Names Identification Based on Class Vector Model[J].Application Research of Computers,2007,24(4):111-113.
Authors:JIA Pin gui  YANG Yi ping  LU Peng
Affiliation:Integrate Information System Research Center, Institute of Automation, Chinese Academy of Sciences, Beijing 100080, China
Abstract:This paper presented an approach for Chinese names identification based on class vector model.The formation of class vector imitated human name identification. Character sequence was tagged using Viterbi algorithm with different class vectors.By checking the class of neighboring class vectors and the change of their components,the possible names were recognized without any template or rule.The test was carried out on real corpus from Internet.The experiments show that the precision and recall rate respectively reach 70.3% and 82.2%.
Keywords:Chinese names identification  class vector model  Viterbi algorithm  character-based
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号