首页 | 本学科首页   官方微博 | 高级检索  
     

基于动态权重的LDA算法
引用本文:居亚亚,杨璐,严建峰. 基于动态权重的LDA算法[J]. 计算机科学, 2019, 46(8): 260-265
作者姓名:居亚亚  杨璐  严建峰
作者单位:苏州大学计算机科学与技术学院 江苏 苏州215006;苏州大学计算机科学与技术学院 江苏 苏州215006;苏州大学计算机科学与技术学院 江苏 苏州215006
基金项目:国家自然科学基金;国家自然科学基金;江苏省科技支撑计划重点项目
摘    要:潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)是一种流行的三层概率主题模型,其实现了文本与文本中的单词在主题层次上的聚类。该模型以词袋(Bag of Words,BOW)模型为假设,所有单词的重要性相同,简化了建模的复杂度,但使得主题分布倾向于高频词,影响了主题模型的语义连贯性。针对此问题,提出了一种基于动态权重的LDA算法,该算法的基本思想是每个单词在建模中具有不同的重要性,在迭代过程中根据单词的主题分布动态生成相应的权重并反作用于主题建模,降低了高频词对建模的影响,提高了关键词:的重要性。在4个公开数据集上的实验表明,基于动态权重的LDA算法在主题语义连贯性、文本分类准确率、泛化性能和精度方面比目前流行的LDA推理算法表现得更加优越。

关 键 词:潜在狄利克雷分布  主题模型  动态权重

LDA Algorithm Based on Dynamic Weight
JU Ya-ya,YANG Lu,YAN Jian-feng. LDA Algorithm Based on Dynamic Weight[J]. Computer Science, 2019, 46(8): 260-265
Authors:JU Ya-ya  YANG Lu  YAN Jian-feng
Affiliation:(School of Computer Science and Technology,Soochow University,Suzhou,Jiangsu 215006,China)
Abstract:JU Ya-ya;YANG Lu;YAN Jian-feng(School of Computer Science and Technology,Soochow University,Suzhou,Jiangsu 215006,China)
Keywords:Latent dirichlet allocation  Topic model  Dynamic weight
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号