首页 | 本学科首页   官方微博 | 高级检索  
     

基于信息熵的半监督领域实体关系抽取研究
引用本文:郭剑毅,雷春雅,余正涛,苏磊,赵君,田维.基于信息熵的半监督领域实体关系抽取研究[J].山东大学学报(工学版),2011,41(4):7-12.
作者姓名:郭剑毅  雷春雅  余正涛  苏磊  赵君  田维
作者单位:1.昆明理工大学信息工程与自动化学院, 云南 昆明 650051;2.昆明理工大学智能信息处理重点实验室, 云南昆明 650051
基金项目:国家自然科学基金项目(60863011); 云南省自然科学基金重点项目资助项目(2008CC023); 云南省中青年学术技术带头人后备人才项目资助项目(2007PY01-11)
摘    要:针对监督机器学习方法抽取实体关系受限于标注语料的规模问题,提出采用信息熵方法来不断扩展小规模训练数据的半监督领域实体关系抽取。结合领域词汇选取小规模训练数据,构建了一定准确率的初始最大熵分类器,用来从未标记数据中预测出候选新实例。采用信息熵方法,通过设定不同熵值,多次循环以选取可信度较高的新实例来扩展训练数据。使用扩展后的训练数据重新迭代训练分类器,分类器性能趋于稳定迭代终止,实现了半监督学习的领域实体关系抽取。实验表明,和已有方法相比,本文提出的半监督领域实体关系抽取通过结合信息熵方法,在小规模标注样本环境中取得了较好的学习效果。

关 键 词:信息熵  半监督  最大熵分类器  未标记  可信度  
收稿时间:2011-02-14

A semi-supervised learning method based on information entropy to extract the domain entity relation
GUO Jian-yi,LEI Chun-ya,YU Zheng-tao,SU Lei,ZHAO Jun,TIAN Wei.A semi-supervised learning method based on information entropy to extract the domain entity relation[J].Journal of Shandong University of Technology,2011,41(4):7-12.
Authors:GUO Jian-yi    LEI Chun-ya  YU Zheng-tao  SU Lei  ZHAO Jun  TIAN Wei
Affiliation:1. School of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650051, China; 2. Key Laboratory of Intelligent Information Processing, Kunming University of Science and Technology, Kunming 650051, China
Abstract:To solve the limitation by the scale of labeled corpus of the supervised learning method,a semi-supervised method based on information entropy was proposed to extract entity relation using small-scale training data.First,combined with field vocabulary to select small-scale training data,an initial maximum entropy classifier of certain accuracy was constructed to predict some new candidate instances from unlabeled data.Second,the method of information entropy was applied by setting different entropy value an...
Keywords:information entropy  semi-supervised  the maximum entropy classifier  unlabeled  credibility  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《山东大学学报(工学版)》浏览原始摘要信息
点击此处可从《山东大学学报(工学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号