首页 | 本学科首页   官方微博 | 高级检索  
     

双层CRF与规则相结合的中文地名识别方法研究
引用本文:孙虹,陈俊杰.双层CRF与规则相结合的中文地名识别方法研究[J].计算机应用与软件,2014(11).
作者姓名:孙虹  陈俊杰
作者单位:太原理工大学科学与技术学院 山西 太原 030024
基金项目:国家重点开放实验室课题项目( SKLSE 2012-09-30)。
摘    要:采用一种基于双层CRF模型与规则相结合的方法提高中文地名的识别性能。第一层CRF模型使用单字特征识别地名,将其结果添加至词典。第二层CRF模型利用词性、左指界词、右指界词和处理后的词典特征对地名进行识别。最后利用规则对识别结果进行过滤修剪和补召。通过双层CRF模型获取文本的远距离特征,解决了同一词汇因位置不同而标记不一致的问题,结合依据地名语言学特点制定的规则提高召回率。实验表明,双层CRF与规则相结合的方法对中文地名的识别取得了较好的效果。对Bakeoff2007的MSRA语料进行开放测试,得到的准确率、召回率、F值分别为95.32%、90.34%、94.12%。

关 键 词:自然语言处理  中文地名识别  双层CRF模型  规则

RESEARCH ON CHINESE TOPONYM RECOGNITION METHOD WITH TWO-LAYER CRF AND RULES COMBINATION
Sun Hong,Chen Junjie.RESEARCH ON CHINESE TOPONYM RECOGNITION METHOD WITH TWO-LAYER CRF AND RULES COMBINATION[J].Computer Applications and Software,2014(11).
Authors:Sun Hong  Chen Junjie
Abstract:
Keywords:Natural language processing  Chinese toponym recognition  Two-layer  CRF model Rules
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号