基于评论与转发的微博联合主题挖掘 |
| |
引用本文: | 赵臣升,吴国文,胡福玲.基于评论与转发的微博联合主题挖掘[J].智能计算机与应用,2016(1):16-20. |
| |
作者姓名: | 赵臣升 吴国文 胡福玲 |
| |
作者单位: | 东华大学计算机科学与技术学院,上海,201620 |
| |
摘 要: | 微博文本简短、信息量少且语法随意,传统主题分类并不理想.Labeled LDA在LDA主题模型上附加类别标签协同计算隐含主题分配量使文本分类效果有所改进,但标签在处理隐式微博或主题频率相近的分类上,存在一定的模糊分配.本文提出的Union Labeled LDA模型通过引入评论转发信息丰富Label标签,进一步提升标签监督下的主题词频强度,一定程度上显化隐式微博、优化同频分配,采用吉布斯采样的方法求解模型.在真实数据集上的实验表明,Union Labeled LDA模型能更有效地对微博进行主题挖掘.
|
关 键 词: | 微博 主题挖掘 LDA Union Labeled LDA 词频 |
Topic mining for union theme Microblog based on comment and retransmission |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|