LDA模型在文本主题建模中的研究与应用 |
| |
作者单位: | ;1.中国航空工业集团公司西安航空计算技术研究所 |
| |
摘 要: | 微博由于其开放、低门槛、终端扩展、内容简洁的特征,已经成为一个信息分享、传播以及获取的大众新闻时事的重要平台,而微博中的海量文本基本都是短文本快节奏的数据,等待我们去分析其中蕴含的大量的信息。这里突出介绍了LDA主题模型和Gibbs Sampling采样算法。通过实验用LDA模型来进行主题挖掘,挖掘出来的每个主题即为该用户的兴趣和爱好。
|
关 键 词: | Gibbs采样 LDA模型 微博文本兴趣挖掘 |
|
|