首页 | 本学科首页   官方微博 | 高级检索  
     

面向网络论坛的突发话题发现
引用本文:陈友,程学旗,杨森.面向网络论坛的突发话题发现[J].中文信息学报,2010,24(3):29-37.
作者姓名:陈友  程学旗  杨森
作者单位:1. 中国科学院 计算技术研究所,北京 100190; 2. 中国科学院 研究生院,北京 100049
基金项目:国家自然科学基金重点项目资助(60933005);;国家973基础研究计划资助项目(2007CB311100);;国家863计划资助项目(2007AA01Z438)
摘    要:每天有大量的信息涌现在论坛上,用户可以通过论坛获知目前国际国内正在发生的一些突发事件。如何使用机器自动化的方法检测论坛中的突发话题已经成为搜索引擎以及网络挖掘系统的一项基础任务。话题检测与跟踪模型(TDT)可以很好的解决话题发现问题,但是TDT处理的对象是新闻语料,与论坛内容相比,新闻语料更准确、严谨、规范。TDT中使用的方法不适合用语随意的论坛。因此在网络论坛这种噪音环境下的话题检测面临着一定的困难与挑战。文中提出一种基于噪音过滤的话题发现模型,它从内容和用户参与度两个角度来检测论坛话题。在“水木社区”的“水木特快”上进行了相关的实验,实验结果表明该文提出的模型不仅可以检测突发话题,而且可以检测与这些话题相对应的用户社区。

关 键 词:计算机应用  中文信息处理  突发话题  网络论坛  时间序列  

Outburst Topic Detection for Web Forums
CHEN You,CHENG Xue qi,YANG Sen.Outburst Topic Detection for Web Forums[J].Journal of Chinese Information Processing,2010,24(3):29-37.
Authors:CHEN You  CHENG Xue qi  YANG Sen
Affiliation:1. Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China;
2. Graduate University of Chinese Academy of Sciences, Beijing 100049, China
Abstract:Web forum has become an important resource on the Web due to its rich information contributed by millions of Internet users every day.Consequently,the outburst topic detection becomes a fundamental task in Search Engine and Web Mining systems.Most existing topic detection and tracking(TDT) methods deal with the news stories,which are proved not suitable for extracting topics in casual,oral and informal languageon the noisy Web formus.This paper presents a noise-filtered model to extract the outburst topics ...
Keywords:computer application  Chinese information processing  outburst topic  web forum  time sequence  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号