首页 | 本学科首页   官方微博 | 高级检索  
     

复杂中文文本的实体关系抽取研究
引用本文:王苑,徐德智,陈建二.复杂中文文本的实体关系抽取研究[J].计算机科学,2009,36(8):208-211.
作者姓名:王苑  徐德智  陈建二
作者单位:中南大学信息科学与工程学院,长沙,410083
基金项目:本课题受国家自然科学基金重点项目,湖南省自然科学基金,湖南省国土资源厅科技计划项目 
摘    要:实体关系抽取是信息抽取研究领域中的重要研究课题之一.针对已有方法在处理复杂文本上的不足,提出了复杂中文文本的实体关系抽取方法.结合中文文本的语法特征,提出了7条抽取关系特征序列的启发式规则,并采用语义序列核和KNN机器学习算法结合的方法来分类和标注关系的类型.通过对ACE评测定义下的两个子类的实体关系抽取,关系抽取的平均F值迭到了76%,明显高于传统的基于特征向量和最短依存路径核的方法.

关 键 词:实体关系抽取  语法特征  启发式规则  语义序列核
收稿时间:9/9/2008 12:00:00 AM
修稿时间:2008/11/26 0:00:00

Entity Relation Extraction for Complex Chinese Text
WAND Yuan,XU De-zhi,CHEN Jian-er.Entity Relation Extraction for Complex Chinese Text[J].Computer Science,2009,36(8):208-211.
Authors:WAND Yuan  XU De-zhi  CHEN Jian-er
Affiliation:College of Information Science and Engineering;Central South University;Changsha 410083;China
Abstract:Entity Relation Extraction is one of the important research fields in Information Extraction.Aiming at the problem of inefficiency of existing approaches dealing with entity relation extraction,this paper presented a novel approach.This new approach proposes seven heuristic rules to extract relation feature sequence through combining with grammar feature of Chinese text,and applies the semantic sequence kernel function with KNN learning algorithm to fulfill the entity relation extraction task.Experiments ar...
Keywords:Entity relation extraction  Grammar feature  Heuristic rule  Semantic sequence kernel  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号