首页 | 本学科首页   官方微博 | 高级检索  
     

融合多特征的最大熵汉语命名实体识别模型
引用本文:张玥杰,徐智婷,薛向阳.融合多特征的最大熵汉语命名实体识别模型[J].计算机研究与发展,2008,45(6):1004-1010.
作者姓名:张玥杰  徐智婷  薛向阳
作者单位:1. 复旦大学计算机科学与工程系 上海 200433
2. 上海市智能信息处理重点实验室 上海 200433
基金项目:国家自然科学基金 , 上海市科技攻关项目
摘    要:最大熵模型能有效整合多种约束信息,对于汉语命名实体识别具有很好的适用性,因此,将其作为基本框架,提出一种融合多特征的最大熵汉语命名实体识别模型,该模型集成局部与全局多种特征,同时为降低搜索空间并提高处理效率,而引入了启发式知识,基于SIGHAN 2008命名实体评测任务测试数据的实验结果表明,所建立的混合模式是一种组合统计模型与启发式知识的有效汉语命名实体识别模式,基于不同测试数据的实验说明,该方法针对不同测试数据源具有一致性.

关 键 词:命名实体识别  最大熵模型  局部特征  全局特征  启发式知识
修稿时间:2007年4月17日

Fusion of Multiple Features for Chinese Named Entity Recognition Based on Maximum Entropy Model
Zhang Yuejie,Xu Zhiting,Xue Xiangyang.Fusion of Multiple Features for Chinese Named Entity Recognition Based on Maximum Entropy Model[J].Journal of Computer Research and Development,2008,45(6):1004-1010.
Authors:Zhang Yuejie  Xu Zhiting  Xue Xiangyang
Affiliation:Zhang Yuejie,Xu Zhiting,, Xue Xiangyang(Department of Computer Science & Engineering,Fudan University,Shanghai 200433)(Shanghai Key Laboratory of Intelligent Information Processing,Shanghai 200433)
Abstract:With the development of natural language processing (NLP) technology, the need for automatic named entity recognition (NER) is highlighted in order to enhance the performance of information extraction systems. The task of NER, which plays a vital role in NLP, is to tag each named entity (NE) in documents with a set of certain NE types. In this paper, a hybrid pattern for Chinese NER based on maximum entropy model is proposed, which fuses multiple features. It differentiates from most of the previous approac...
Keywords:named entity recognition  maximum entropy model  local feature  global feature  heuristic human knowledge  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号