首页 | 本学科首页   官方微博 | 高级检索  
     

基于事件实例驱动的新闻文本事件抽取
引用本文:许旭阳,李弼程,张先飞,韩永峰.基于事件实例驱动的新闻文本事件抽取[J].计算机科学,2011,38(8):232-235.
作者姓名:许旭阳  李弼程  张先飞  韩永峰
作者单位:(解放军信息工程大学信息工程学院 郑州450002)
基金项目:本文受国家社科重大基金项目(09&ZD014)和国家863项目(2007AA01Z439)资助。
摘    要:目前,事件抽取的流行方法是以事件元素或触发词进行驱动,但该方法容易导致正反例不平衡,且在语料库规模较小时存在一定的数据稀疏问题。提出了一种基于事件实例驱动的事件抽取方法。首先,从文档句子中抽取出刻画一个事件发生有代表性的特征,构成候选事件实例表示;其次,通过二元分类器对新闻文本中的事件实例与非事件实例进行分类;最后,对事件实例采用基于层次聚类的k-mcdoids算法完成事件抽取。该方法不仅克服了正反例失衡以及数据稀疏问题,而且解决了预先定义事件类别的局限性。实验结果验证了该方法的有效性,对比传统方法,事件抽取的准确率与召回率均获得了显著的提高。

关 键 词:事件实例,分类,新闻文本,聚类,事件抽取

News Text Event Extraction Driven by Event Sample
XU Xu-yang,LI Bi-cheng,ZHANG Xian-fei,HAN Yong-feng.News Text Event Extraction Driven by Event Sample[J].Computer Science,2011,38(8):232-235.
Authors:XU Xu-yang  LI Bi-cheng  ZHANG Xian-fei  HAN Yong-feng
Affiliation:(Information Engineering Institate,PLA Information Engineering University,Zhengzhoa 450002,China)
Abstract:
Keywords:Event sample  Classification  News text  Clustering  Event extraction
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号