首页 | 本学科首页   官方微博 | 高级检索  
     

开放式文本信息抽取
引用本文:赵军,刘康,周光有,蔡黎.开放式文本信息抽取[J].中文信息学报,2011,25(6):98-111.
作者姓名:赵军  刘康  周光有  蔡黎
作者单位:中国科学院 自动化研究所 模式识别国家重点实验室,北京 100190
基金项目:国家自然科学基金资助项目(60875041,61070106)
摘    要:信息抽取研究已经从传统的限定类别、限定领域信息抽取任务发展到开放类别、开放领域信息抽取。技术手段也从基于人工标注语料库的统计方法发展为有效地挖掘和集成多源异构网络知识并与统计方法结合进行开放式信息抽取。该文在回顾文本信息抽取研究历史的基础上,重点介绍开放式实体抽取、实体消歧和关系抽取的任务、难点、方法、评测、技术水平和存在问题,并结合课题组的研究积累,对文本信息抽取的发展方向以及在网络知识工程、问答系统中的应用进行分析讨论。

关 键 词:开放式信息抽取  知识工程  文本理解  

Open Information Extraction
ZHAO Jun,LIU Kang,ZHOU Guangyou,CAI Li.Open Information Extraction[J].Journal of Chinese Information Processing,2011,25(6):98-111.
Authors:ZHAO Jun  LIU Kang  ZHOU Guangyou  CAI Li
Affiliation:National Laboratory of Pattern Recognition, Institute of Automation,
Chinese Academy of Sciences, Beijing 100190, China
Abstract:The research on information extraction is being developed into open information extraction,i.e.extracting open categories of entities,relations and events from open domain text resources.The methods used are also transferred from pure statistical machine learning model based on human annotated corpora into statistical learning model incorporated with knowledge bases mined from large-scaled and heterogeneous Web resources.This paper firstly reviews the history of the researches on information extraction,then...
Keywords:open information extraction  knowledge engineering  text understanding  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号