首页 | 本学科首页   官方微博 | 高级检索  
     

面向互联网新闻的在线话题检测算法
引用本文:程葳,龙志袆. 面向互联网新闻的在线话题检测算法[J]. 计算机工程, 2009, 35(18): 28-30
作者姓名:程葳  龙志袆
作者单位:北京城市学院人工智能研究所,北京,100083;北京城市学院人工智能研究所,北京,100083
基金项目:北京市教育委员会科技发展计划面上基金资助项目 
摘    要:针对互联网新闻报道冗余多、议题发散、易漂移等特点,提出一种面向互联网的在线话题检测算法。该算法针对冗余问题提出子话题概念,针对议题发散问题建立双层检测结构,针对话题漂移问题提出基于滑动窗口的跟踪策略。应用该算法建立网上话题检测系统,通过来源于互联网的真实数据进行测试。结果表明,算法性能优于传统的单路径聚类算法,其最小错误代价率低于0.14。

关 键 词:在线话题检测  话题检测与跟踪  文本聚类
修稿时间: 

Online Topic Detection Algorithm for Internet News
CHENG Wei,LONG Zhi-yi. Online Topic Detection Algorithm for Internet News[J]. Computer Engineering, 2009, 35(18): 28-30
Authors:CHENG Wei  LONG Zhi-yi
Affiliation:Institute of Artificial Intelligence;Beijing City University;Beijing 100083
Abstract:This paper analyses the Internet news reports and finds their characteristics such as redundancy, low centralization of the discussions and the topic drift.An Online Topic Detection(ODT) method for Internet is proposed.It defines the sub-topic to ignore the redundancies reports, presents the double-lays configuration for the low centralization of the discussions, and advances a topic tracking algorithm based on the sliding window.A topic detection system is build according to the method.The system is tested...
Keywords:Online Topic Detection(ODT)  Topic Detection and Tracking(TDT)  text clustering
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号