首页 | 本学科首页   官方微博 | 高级检索  
     

基于长距离依赖条件随机域的文本信息抽取
引用本文:朱道辉,肖基毅,程阳,吴诗祥.基于长距离依赖条件随机域的文本信息抽取[J].计算机应用与软件,2011,28(5).
作者姓名:朱道辉  肖基毅  程阳  吴诗祥
作者单位:1. 南华大学计算机科学与技术学院,湖南,衡阳,421001
2. 广西师范大学生命科学学院,广西,桂林,541004
3. 武冈市大田乡中心小学,湖南,武冈,422400
摘    要:信息抽取中,同-token在文本中可能出现多次,且token多次出现的位置通常相隔很远,传统线性链CRF模型由于Markov假设不能表达长距离依赖关系于是将多次出现的同-token分开标注,丧失了全局信息.提出了长距离依赖条件随机域模型,该模型能结合多次出现的同-token各处的特征,对其进行联合标注.由于长距离依赖使得精确的标注算法不可计算,采用了TRP估计算法.实验表明该模型抽取性能优于线性链CRF模型,尤其是speaker域上的召回率有了很大的提高.

关 键 词:长距离依赖  条件随机域  线性链  同-token  文本

TEXT INFORMATION EXTRACTION BASED ON CONDITIONAL RANDOM FIELDS WITH LONG-DISTANCE DEPENDENCIES
Zhu Daohui,Xiao Jiyi,Cheng Yang,Wu Shixiang.TEXT INFORMATION EXTRACTION BASED ON CONDITIONAL RANDOM FIELDS WITH LONG-DISTANCE DEPENDENCIES[J].Computer Applications and Software,2011,28(5).
Authors:Zhu Daohui  Xiao Jiyi  Cheng Yang  Wu Shixiang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号