首页 | 本学科首页   官方微博 | 高级检索  
     

采用主动学习策略的组织机构名识别
引用本文:冯冲,陈肇雄,黄河燕.采用主动学习策略的组织机构名识别[J].小型微型计算机系统,2006,27(4):710-714.
作者姓名:冯冲  陈肇雄  黄河燕
作者单位:1. 中国科学技术大学,计算机科学与技术系,安徽,合肥,230027;中国科学院,计算机语言信息工程研究中心,北京,100083
2. 中国科学院,计算机语言信息工程研究中心,北京,100083
基金项目:中国科学院资助项目;国家科技攻关项目
摘    要:组织机构名等命名实体的识别是信息抽取、机器翻译等任务的重要基础.为了克服识别器训练过程中对标注数据的依赖。本文提出了一种基于主动学习的训练策略。改进了基本的最大熵模型的解码算法和训练过程,实验表明采用主动学习策略的最大熵模型训练算法能够有效减少标注数据的使用。

关 键 词:主动学习  命名实体识别  最大熵模型  组织机构名
文章编号:1000-1220(2006)-0710-05
收稿时间:09 28 2004 12:00AM
修稿时间:2004-09-28

Organization Names Recognition with Active Learning
FENG Chong,CHEN Zhao-xiong,HUANG He-yan.Organization Names Recognition with Active Learning[J].Mini-micro Systems,2006,27(4):710-714.
Authors:FENG Chong  CHEN Zhao-xiong  HUANG He-yan
Abstract:The recognition of organization names is one of the fundamental tasks in Information Extraction and Machine Translation. To minimize the dependency on the labeled data used to training the model, an improved training strategy based on actire learning is proposed, and the classical recognition system can be elevated rapidly maximum entropy model is extended. The even with small account of selected labeled experiments show that performance of the samples, which prove the efficiency of the active learning training strategies.
Keywords:active learning  named entity recognition  maximum entropy model  organization names
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号