首页 | 本学科首页   官方微博 | 高级检索  
     

中文事件相关性语料库构建及识别方法
引用本文:黄一龙,李培峰,朱巧明.中文事件相关性语料库构建及识别方法[J].计算机工程与科学,2015,37(12):2306-2311.
作者姓名:黄一龙  李培峰  朱巧明
作者单位:;1.苏州大学计算机科学与技术学院;2.江苏省计算机信息处理技术重点实验室
基金项目:国家自然科学基金资助项目(61472265);国家自然科学基金重点资助项目(61331011);江苏省前瞻性联合研究资助项目(BY2014059 08);软件新技术与产业化协同创新中心部分资助项目
摘    要:事件往往围绕主题展开,相互间存在相关性。在大数据时代,从海量信息中筛选出和某个主题相关的事件,有助于信息抽取、文本摘要、文本生成等自然语言处理任务。首先提出一种相关事件的标注方法,并标注了一个中文事件相关性语料库。然后,初步提出了一个基于多种特征的相关性事件识别方法。在标注语料上的实验表明,性能在基准系统上F1值提高了4.08%。

关 键 词:相关事件语料库  标注  相关性  事件关系
收稿时间:2015-09-03
修稿时间:2015-12-25

Construction and its recognition of Chinese relevant event
HUANG Yi long,LI Pei feng,ZHU Qiao ming.Construction and its recognition of Chinese relevant event[J].Computer Engineering & Science,2015,37(12):2306-2311.
Authors:HUANG Yi long  LI Pei feng  ZHU Qiao ming
Affiliation:(1.School of Computer Science and Technology,Soochow University,Suzhou 215006;2.Province Key Lab of Computer Information Processing Technology of Jiangsu,Suzhou 215006,China)
Abstract:There are many relevant events concerning a topic. In the era of big data, extracting those events which are relevant to a specific topic is helpful for many natural language processing applications, such as information extraction, text summarization, and text generation. We propose a method to annotate relevant events and construct a Chinese relevant event corpus. We then put forward a relevant event recognition approach based on various distances and semantic features. Experimental results on the annotated corpus show that the proposed approach outperforms the baseline by 4.08% in F1-measure.
Keywords:relevant event corpus  annotation  relevance  event relation  
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号