一种基于关键词的微博话题聚类算法 |
| |
作者单位: | ;1.桂林电子科技大学 |
| |
摘 要: | 由于微博跟现实生活有着密不可分的联系,微博的话题聚类可以发掘人们所关注的话题,有利于引导公众舆情。由于传统的文本聚类方法主要适用于长文本,LDA(Latent Dirichlet Allocation)话题模型是一个比较成熟也比较全面的话题聚类方法,实验中利用LDA模型来发掘当前公众讨论的热点话题,提出一种文本关联词算法。利用LDA得到的关键词进行聚类分析,也可以对LDA话题聚类后的结果进行优化调整,得到的结果与标注数据集进行对比分析,实验结果证明该算法能够提高聚类的正确率、召回率和F值。
|
关 键 词: | 微博 主题模型 文本聚类 关联词算法 |
A MICROBLOG TOPIC CLUSTERING ALGORITHM BASED ON KEYWORDS |
| |
Abstract: | |
| |
Keywords: | |
|
|