首页 | 本学科首页   官方微博 | 高级检索  
     

基于内容分析的中文BBS话题检测系统的设计与实现
引用本文:赵艳红,聂哲. 基于内容分析的中文BBS话题检测系统的设计与实现[J]. 计算机应用与软件, 2011, 28(6)
作者姓名:赵艳红  聂哲
作者单位:深圳职业技术学院电子与信息工程学院,广东深圳,518055
基金项目:深圳市科技计划项目资助课题
摘    要:通过对BBS话题模型、话题相似度、话题检测评价标准以及话题趋势的分析和研究,提出了基于内容分析的中文BBS话题检测算法:通过爬虫获取BBS信息;采用基于URL和Xpath的网页模板处理BBS信息;应用ICTLAS实现BBS信息的分词;采用Carrot2对BBS话题进行聚类,基于功率谱的热点话题分析以及基于时间序列的话题预测.最后,通过采用J2EE开发包及Eclipse 集成开发环境,结合Hibernate、GWT等技术实现了中文BBS话题检测系统,并在多个BBS论坛上进行了测试,取得了良好的效果.

关 键 词:BBS话题检测  网络爬虫  话题聚类  热点分析

DESIGN AND IMPLEMENTATION OF CHINESE BBS TOPIC DETECTION SYSTEM BASED ON CONTENT ANALYSIS
Zhao Yanhong,Nie Zhe. DESIGN AND IMPLEMENTATION OF CHINESE BBS TOPIC DETECTION SYSTEM BASED ON CONTENT ANALYSIS[J]. Computer Applications and Software, 2011, 28(6)
Authors:Zhao Yanhong  Nie Zhe
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号