首页 | 本学科首页   官方微博 | 高级检索  
     

基于词嵌入与概率主题模型的社会媒体话题识别
作者单位:;1.深圳大学计算机与软件学院
摘    要:词嵌入技术能从大语料库中捕获词语的语义信息,将其与概率主题模型结合可解决标准主题模型缺乏语义信息的问题。为此,同时对词嵌入和主题模型进行改进,构建词-主题混合模型。在主题词嵌入(TWE)模型中引入外部语料库获得初始主题和单词表示,通过定义主题向量和词嵌入的条件概率分布,将词嵌入特征表示和主题向量集成到主题模型中,同时最小化新词-主题分布函数和原始词-主题分布函数的KL散度。实验结果表明,与Word2vec、TWE、LDA和LFLDA模型相比,该模型在词表示和主题检测方面性能更好。

关 键 词:社会媒体  话题检测  特征表示  词嵌入  话题模型  词-主题混合模型

Social Media Topic Recognition Based on Word Embedding and Probabilistic Topic Model
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号