首页 | 本学科首页   官方微博 | 高级检索  
     

一种融合实体语义知识的实体集合扩展方法
引用本文:齐振宇,刘康,赵军.一种融合实体语义知识的实体集合扩展方法[J].中文信息学报,2013,27(2):1-10.
作者姓名:齐振宇  刘康  赵军
作者单位:中国科学院 自动化研究所 模式识别国家重点实验室,北京 100190
基金项目:国家自然科学基金资助项目,国家973计划资助项目,中国科学院先导专项资助项目,国家863高科技计划资助项目,清华大学信息科学与技术国家实验室
摘    要:实体集合扩展是开放式信息抽取的一个重要问题,该问题研究如何从一个语义类的若干实体(称为种子)出发,得到该类别的更多实体。现有实体集合扩展方法主要使用上下文模板或种子在语料中的分布信息进行抽取,其缺点是无法解决种子的歧义问题,而该问题会影响方法的有效性。在该文中,作者提出了一种融合实体语义知识的实体集合扩展方法,通过引入语义知识来解决种子歧义性问题。新方法通过使用Wikipedia实现了语义知识的引入,并把基于语义知识的扩展方法和基于模板的扩展方法相融合。实验表明,与单纯基于上下文方法相比,该文方法在准确率上提升了18.5%,召回率上提升了6.8%,MAP值上提升了22.8%。

关 键 词:实体集合扩展  知识库  语义知识  

A Novel Entity Set Expansion Method Leveraging Entity Semantic Knowledge
QI Zhenyu , LIU Kang , ZHAO Jun.A Novel Entity Set Expansion Method Leveraging Entity Semantic Knowledge[J].Journal of Chinese Information Processing,2013,27(2):1-10.
Authors:QI Zhenyu  LIU Kang  ZHAO Jun
Affiliation:National Laboratory of Pattern Recognition, Institute of Automation,
Chinese Academy of Sciences, Beijing 100190, China
Abstract:Entity Set Expansion is one of the important problems in Open Information Extraction. Entity Set Expansion refers to expanding several given seeds of one concept into a more complete set. Most approaches solve the problem by using context or distributional information, suffering from the limitation of seed ambiguity problem which results in poor results. In this paper we present a novel method which introduces the semantic knowledge by leveraging Wikipedia knowledge base. We combine this method with traditional template based method. Experiment results show that the proposed method improves 18.5% in precision, 6.8% in recall and 22.8% in MAP.
Key wordsEntity Set Expansion; knowledge base; semantic knowledge
Keywords:Entity Set Expansion  knowledge base  semantic knowledge  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号