首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于共坐标上升算法的人名识别方法
引用本文:戴播,毛奇,袁春风. 一种基于共坐标上升算法的人名识别方法[J]. 计算机应用与软件, 2010, 27(4): 7-9,22
作者姓名:戴播  毛奇  袁春风
作者单位:南京大学计算机软件新技术国家重点实验室,江苏,南京,210093
基金项目:国家863高科技重点项目(2006AA010109);;国家自然科学基金(60673043)
摘    要:共坐标上升算法(coordinate ascent algorithm)是一种迭代优化技术,可以用来指导特征权值的训练。提出一种基于该算法的中国人名识别方法,避免了已有的一些方法中人为指定特征权值的问题,更好地体现特征之间存在的隐含关系。该方法从基础语料中获取特征库及成名概率词典,在训练语料上提取相应特征后,采用共坐标上升学习算法训练得到特征权重以及成名阈值参数,运用学习得到的各参数对普通文本中的中国人名进行识别。提出的方法无需对训练语料进行人工标注,在人名识别时也无需进行分词和词性标注处理,代价低、性能优良、有较好的实用性,在开放测试集上F1值达到93.02%。

关 键 词:共坐标上升算法  人名识别  特征权重训练  

NAME ENTITY RECOGNITION BASED ON COORDINATE ASCENT ALGORITHM
Dai Bo,Mao Qi,Yuan Chunfeng. NAME ENTITY RECOGNITION BASED ON COORDINATE ASCENT ALGORITHM[J]. Computer Applications and Software, 2010, 27(4): 7-9,22
Authors:Dai Bo  Mao Qi  Yuan Chunfeng
Affiliation:State Key Laboratory for Novel Software Technology/a>;Nanjing University/a>;Nanjing 210093/a>;Jiangsu/a>;China
Abstract:Coordinate ascent algorithm is an iterative optimisation technique,and can be used to guide the features' weights training. In this paper,we proposed a method for Chinese name recognition based on this algorithm,which reflects the hidden dependence among features better,and also avoids the problem in some approaches that the feature weights are manually assigned. The method goes as follows. Primarily,we get features library and character-for-name probability dictionary from the fundamental corpus,after extr...
Keywords:Coordinate ascent algorithm Name entity recognition Features' weights training  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号