首页 | 本学科首页   官方微博 | 高级检索  
     

面向微博热点话题发现的多标签传播聚类方法研究
引用本文:陈羽中,方明月,郭文忠.面向微博热点话题发现的多标签传播聚类方法研究[J].模式识别与人工智能,2015(1).
作者姓名:陈羽中  方明月  郭文忠
作者单位:福州大学 福建省网络计算与智能信息处理重点实验室 福州350108; 福州大学 数学与计算机科学学院 福州350108
基金项目:国家自然科学基金项目,福建省教育厅重点项目,福建省科技创新平台项目,福建省自然科学基金项目
摘    要:微博热点话题发现是目前的研究热点。针对传统热词抽取方法难以适用于微博数据的问题,提出一种基于老化理论的词生命值计算模型用于热词抽取,并基于热词间的相关性构建词共现网络;针对传统的词聚类算法不能较好地解决话题间存在重叠热词以及时间效率不佳的问题,引入多标签传播思想,设计一种接近线性时间复杂度的多标签传播聚类算法( TCMLPA)用于词共现网络的热词聚类,获得热点话题集。实验结果表明,词生命值计算模型能够有效过滤噪声并提取热词,TCMLPA算法则能够在保证聚类结果稳定性的情况下,有效提高热点话题发现的精度和效率。

关 键 词:微博  热点话题发现  老化理论  热词抽取  多标签传播

Research on Multi-Label Propagation Clustering Method for Microblog Hot Topic Detection
CHEN Yu-Zhong,FANG Ming-Yue,GUO Wen-Zhong.Research on Multi-Label Propagation Clustering Method for Microblog Hot Topic Detection[J].Pattern Recognition and Artificial Intelligence,2015(1).
Authors:CHEN Yu-Zhong  FANG Ming-Yue  GUO Wen-Zhong
Abstract:
Keywords:Microblog  Hot Topic Detection  Aging Theory  Hot Term Extraction  Multi-label Propagation
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号