首页 | 本学科首页   官方微博 | 高级检索  
     

基于统计的中文地名自动识别研究
引用本文:邱莎,阿圆,王付艳,丁海燕.基于统计的中文地名自动识别研究[J].计算机技术与发展,2011,21(11).
作者姓名:邱莎  阿圆  王付艳  丁海燕
作者单位:1. 昆明学院信息技术学院,云南昆明650214;复旦大学计算机科学技术学院,上海201203
2. 昆明学院信息技术学院,云南昆明,650214
3. 云南大学信息学院,云南昆明,650091
基金项目:云南省教育科研资助项目,昆明学院科研课题基金
摘    要:中文地名的自动识别是命名实体识别任务中难度较大的任务之一,目的是从中文文本中自动准确提取地理专用名词.文中使用统计模型中的条件随机场对中文地名的自动识别在字一级粒度进行了研究.在研究中利用条件随机场能任意添加特征的优点,合理引用了丰富的特征组合,在大规模语料上进行训练,统计获得标注序列基于特征集的条件概率分布,并采用序列标注的方式,实现中文地名的自动识别.多次闭合测试和开放测试结果F1值为90%左右,识别效果良好.

关 键 词:中文地名识别  条件随机场  特征模板

Study on Automatic Recognition of Chinese Location Names Based on Statistical Method
QIU Sha,A Yuan,WANG Fu-yan,DING Hai-yan.Study on Automatic Recognition of Chinese Location Names Based on Statistical Method[J].Computer Technology and Development,2011,21(11).
Authors:QIU Sha  A Yuan  WANG Fu-yan  DING Hai-yan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号