首页 | 本学科首页   官方微博 | 高级检索  
     

基于混合模型的中国人名自动识别
作者姓名:毛婷婷  李丽双  黄德根
作者单位:大连理工大学 计算机科学与工程系,辽宁 大连 116024)
摘    要:本文提出了一种支持向量机(SVM)和概率统计模型相结合的中国人名自动识别方法。该方法首先按字抽取特征向量的属性得到训练集,采用多项式核函数建立SVM人名识别模型,然后在特征空间中计算测试样本到SVM最优超平面的距离,当该距离大于给定的阈值时使用SVM对测试样本进行分类,否则使用概率统计方法。实验表明,采用混合模型,对样本在空间的不同分布使用不同的方法可以取得比单独使用SVM或概率统计更好的分类效果,系统开式综合指标F-值比单纯使用支持向量机方法提高了1.51%。

关 键 词:计算机应用  中文信息处理  支持向量机  概率统计  混合模型  人名识别  
文章编号:1003-0077(2007)02-0022-07
收稿时间:2006-04-08
修稿时间:2006-07-28
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号