首页 | 本学科首页   官方微博 | 高级检索  
     

信息抽取研究综述
引用本文:李保利,陈玉忠,俞士汶.信息抽取研究综述[J].计算机工程与应用,2003,39(10):1-5,66.
作者姓名:李保利  陈玉忠  俞士汶
作者单位:北京大学计算机科学与技术系计算语言学研究所,北京,100871
基金项目:国家自然科学基金项目(编号:69973005),国家973重点基础研究发展规划项目(编号:G1998030507-4),北大985项目支持
摘    要:信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹———通过系统化、大规模的定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。

关 键 词:自然语言处理  信息抽取  信息检索  命名实体识别
文章编号:1002-8331-(2003)10-0001-05

Research on Information Extraction:A Survey
Li,Baoli Chen Yuzhong Yu,Shiwen.Research on Information Extraction:A Survey[J].Computer Engineering and Applications,2003,39(10):1-5,66.
Authors:Li  Baoli Chen Yuzhong Yu  Shiwen
Abstract:The research on Information Extraction aims at providing more powerful information access tools to help peo-ple overcome the problem of information overloading.Unlike Information Retrieval,Information Extraction Systems extract factual information directly from natural language texts.In the last decade,Information Extraction has become an impor-tant sub-field of Natural Language Processing.Its unique development track,i.e.accelerating research via systematical and large scale evaluation,and some successful experience,such as the effectiveness of partial-parsing techniques and the importance of fast development cycles,have made it a great and most important impetus to the research of NLP in the last decade.Moreover,Information Extraction has built a more effective connection between NLP researchers and NLP system developers.It will be helpful to review the history and investigate the state of the art of Information Extraction.
Keywords:Natural Language Processing  Information Extraction  Information Retrieval  Named Entity Recognization  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号