首页 | 本学科首页   官方微博 | 高级检索  
     

基于词元再评估的新事件检测模型
引用本文:张 阔,李涓子,吴 刚,王克宏.基于词元再评估的新事件检测模型[J].软件学报,2008,19(4):817-828.
作者姓名:张 阔  李涓子  吴 刚  王克宏
作者单位:清华大学,计算机科学与技术系,北京,100084
基金项目:国家自然科学基金No.90604025~~
摘    要:新事件检测(new event detection,简称NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻.初步实验发现,在对不同类别的新闻报道进行新事件检测时,其不同类型的词元往往具有不同的敏感程度.而传统方法往往将所有的词元等同看待.重点研究在新事件检测模型中,对于不同词元的权重设定问题.提出利用统计方法优化不同类别新闻对于不同词性词元的权重参数;提出利用已有新闻簇信息动态更新词元权重的方法,采用在新闻之间(而非新闻与新闻簇之间)计算相似度的形式,发挥两种比较形式的优点.在Linguistic Data Consortium(LDC)公共数据集TDT2与TDT3上进行实验,实验结果表明,这两种改进方法的效果明显,性能与同类系统相比有显著提升.

关 键 词:新事件检测  信息检索  命名实体  词元再评估  
收稿时间:2006/10/30 0:00:00
修稿时间:2006年10月30

A New Event Detection Model Based on Term Reweighting
ZHANG Kuo,LI Juan-Zi,WU Gang and WANG Ke-Hong.A New Event Detection Model Based on Term Reweighting[J].Journal of Software,2008,19(4):817-828.
Authors:ZHANG Kuo  LI Juan-Zi  WU Gang and WANG Ke-Hong
Affiliation:Department of Computer Science and Technology;Tsinghua University;Beijing 100084;China
Abstract:New event detection(NED)is aimed at detecting from one or multiple streams of news stories the one being reported on a new event(i.e.not reported previously).Preliminary experiments show that terms of different types(e.g.Noun and Verb)have different effects for different classes of stories in determining whether or not two stories are on the same topic.Unfortunately,conventional approaches usually ignore the fact.This paper proposes a NED model utilizing two approaches to addressing the problem based on ter...
Keywords:new event detection  information retrieval  name entity  term reweighting  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号