首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于标签的改进主题演化模型
引用本文:姚立,张曦煌. 一种基于标签的改进主题演化模型[J]. 计算机工程, 2019, 45(4): 205-210,216
作者姓名:姚立  张曦煌
作者单位:江南大学物联网工程学院,江苏无锡,214122;江南大学物联网工程学院,江苏无锡,214122
摘    要:传统主题演化(ToT)模型通常忽略原始数据中的标签元信息。为此,建立一种基于标签的改进ToT模型。针对传统权重算法忽略词汇在文档集类别间和类别内的分布对权重产生影响的问题,结合文档标题特征,使用改进词频-反重力距算法进行权重分析,以扩展模型的生成过程。在ToT模型的基础上引入原始文档的标签属性,构建改进模型并使用吉布斯采样算法估计其参数。实验结果表明,与ToT模型相比,该模型具有较高的泛化能力。

关 键 词:标签  主题演化模型  隐狄利克雷分配  词频-反重力距算法  吉布斯采样

An Improved Topics over Time Model Based on Label
YAO Li,ZHANG Xihuang. An Improved Topics over Time Model Based on Label[J]. Computer Engineering, 2019, 45(4): 205-210,216
Authors:YAO Li  ZHANG Xihuang
Affiliation:(School of Internet of Things Engineering,Jiangnan University,Wuxi,Jiangsu 214122,China)
Abstract:YAO Li;ZHANG Xihuang(School of Internet of Things Engineering,Jiangnan University,Wuxi,Jiangsu 214122,China)
Keywords:label  Topics over Time(ToT) model  Latent Dirichlet Allocation(LDA)  TF-IGM algorithm  Gibbs sampling
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号