首页 | 本学科首页   官方微博 | 高级检索  
     

一种非监督的事件触发词检测和分类方法
引用本文:陈自岩,黄宇,王洋,傅兴玉,付琨. 一种非监督的事件触发词检测和分类方法[J]. 国外电子测量技术, 2016, 35(7): 91-95
作者姓名:陈自岩  黄宇  王洋  傅兴玉  付琨
作者单位:1. 中国科学院大学北京100049;2. 中国科学院空间信息处理与应用系统重点实验室北京100190,中国科学院空间信息处理与应用系统重点实验室北京100190,中国科学院空间信息处理与应用系统重点实验室北京100190,中国科学院空间信息处理与应用系统重点实验室北京100190,中国科学院空间信息处理与应用系统重点实验室北京100190
基金项目:国家自然科学基金(61331017)项目资助
摘    要:事件触发词检测和分类是事件抽取中至关重要的第一步。传统的抽取和分类方法往往倾向于监督学习方法,如条件随机场、SVM等,但由于这类方法需要繁重的人工标注且受限于预先定义好的类别,因此很难在开放领域中得到应用。提出了一种非监督的事件触发词检测和分类方法,利用主题模型获取候选触发词在主题上的分布,然后利用二值状态自动机模型捕获高概率的主题,从而筛选出真正的事件触发词和相应的分类。在大规模的未标注新浪新闻数据集上的实验结果充分验证了本文方法的有效性。

关 键 词:事件触发词检测和分类;主题模型;二值状态自动机模型

Unsupervised method for event trigger identification and classification
Chen Ziyan,Huang Yu,Wang Yang,Fu Xingyu and Fu Kun. Unsupervised method for event trigger identification and classification[J]. Foreign Electronic Measurement Technology, 2016, 35(7): 91-95
Authors:Chen Ziyan  Huang Yu  Wang Yang  Fu Xingyu  Fu Kun
Abstract:The identification and classification of event trigger plays a decisive role in event extraction. Usually, the trigger words are extracted based on supervised machine learning methods such as CRF. However, since these methods rely on expensive manual annotation and require predefined event types, they are not sufficient for open domain application. In this paper, we present an unsupervised method for event trigger identification and classification. First, we run a topic model to obtain the topic distribution over each candidate trigger word. Then, an improved two state automaton is proposed to detect the real trigger word and capture the corresponding topics. The experiment on a large unlabeled corpus shows our unsupervised model is very inspiring.
Keywords:event trigger identification and classification   topic model   two state automaton
点击此处可从《国外电子测量技术》浏览原始摘要信息
点击此处可从《国外电子测量技术》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号