首页 | 本学科首页   官方微博 | 高级检索  
     

基于模式的远监督关系抽取算法
引用本文:王加楠,鲁 强.基于模式的远监督关系抽取算法[J].中文信息学报,2017,31(4):122-131.
作者姓名:王加楠  鲁 强
作者单位:中国石油大学(北京) 计算机科学与技术系, 北京 102249
基金项目:国家自然科学基金(61402532)
摘    要:远监督关系抽取算法能够自动将关系库中的关系与无标注的文本对齐,以进行文本中的关系抽取。目前提出的远监督关系抽取算法中,大多数是基于特征的。然而,此类算法在将实例转换为特征时,经常会出现关键信息不突出、数据集线性不可分等问题,影响关系抽取的效果。该文提出了一种基于模式的远监督关系抽取算法,其中引入了基于模式的向量,并使用了基于核的机器学习算法来克服上述问题。实验结果表明,该文提出的基于模式的远监督关系抽取算法,能够有效地提升远监督关系抽取的准确率。

关 键 词:远监督  关系抽取  模式  核方法  

Pattern-Based Distant Supervision for Relation Extraction Algorithm
WANG Jianan,LU Qiang.Pattern-Based Distant Supervision for Relation Extraction Algorithm[J].Journal of Chinese Information Processing,2017,31(4):122-131.
Authors:WANG Jianan  LU Qiang
Affiliation:Department of Computer Science and Technology, China University of Petroleum, Beijing 102249, China
Abstract:Distant supervision for relation extraction is an approach that can extract relations from texts automatically by aligning a database of facts with texts. Most of existing solutions are feature-based algorithms with certain defects. In this paper, we propose a pattern-based algorithm for distant supervised relation extraction with pattern-based vector. A kernel-based method is used in the algorithm to overcome the problems in feature-based algorithm. The experimental result shows that our algorithm can successfully improve the precision of distant supervision for relation extraction.
Keywords:distant supervision  relation extraction  pattern  kernel method  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号