首页 | 本学科首页   官方微博 | 高级检索  
     

基于LDA和Word2vec的微博标签生成算法
引用本文:陈瀛,生佳根.基于LDA和Word2vec的微博标签生成算法[J].计算机与现代化,2021(12):37-42.
作者姓名:陈瀛  生佳根
作者单位:江苏科技大学计算机学院,江苏 镇江 212100
摘    要:针对基于传统LDA主题模型的标签生成算法对用户兴趣主题描述不完整的问题,提出一种基于主题嵌入表示的微博用户标签生成算法TopicERP.该算法在LDA模型的基础上,通过引入Word2vec词嵌入模型,对用户兴趣主题进行全面描述,并对匹配度计算方法进行改进.首先利用LDA主题模型对用户微博进行主题分析,生成用户兴趣主题;然后利用Word2vec词嵌入模型将主题文本转换为主题向量,用于匹配度计算;最后,利用余弦相似度和主题在文档中的条件概率,计算主题向量与候选标签匹配度,选取Top-Q的候选标签作为目标用户标签.本文在公开微博数据集microPCU上进行实验,实验结果表明,该算法在总体性能上高于基于传统LDA主题模型的微博标签生成算法,生成的用户标签能够较为准确地描述用户的兴趣偏好.

关 键 词:标签生成  LDA  Word2vec  微博

Weibo Tag Generation Algorithm Based on LDA and Word2 vec
CHEN Ying,SHENG Jia-gen.Weibo Tag Generation Algorithm Based on LDA and Word2 vec[J].Computer and Modernization,2021(12):37-42.
Authors:CHEN Ying  SHENG Jia-gen
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号