首页 | 本学科首页   官方微博 | 高级检索  
     

基于网络短文本主题挖掘技术研究
引用本文:冯鑫,汤鲲.基于网络短文本主题挖掘技术研究[J].计算机与数字工程,2021,49(5):952-956,992.
作者姓名:冯鑫  汤鲲
作者单位:武汉邮电科学研究院 武汉 430074;南京烽火天地通信科技有限公司 南京 210019;武汉邮电科学研究院 武汉 430074;南京烽火星空通信发展有限公司 南京 210000
摘    要:由于短文本内容少,在语义特征上短文本要比长文本匮乏的多,传统的主题模型对于普通文档非常有效,然而严重的数据稀疏问题使得短文本主题建模困难.为了解决这一问题,提出了GBDP(Gravity Biterm Topic Model Hierarchical Dirichlet Process)模型,它是一种基于BTM(Biterm Topic Model)的Dirichlet过程,同时结合CRP(Chinese Restaurant Process)不仅考虑词汇之间相关性而且也考虑到了词对之间的联系,最后对实际数据进行了对比实验,结果表明GBDP在主题质量和困惑度方面效果显著.

关 键 词:狄利克雷过程  LDA  BTM  GBDP  主题挖掘

Research on Topic Mining Technology Based on Network Short Article
FENG Xin,TANG Kun.Research on Topic Mining Technology Based on Network Short Article[J].Computer and Digital Engineering,2021,49(5):952-956,992.
Authors:FENG Xin  TANG Kun
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号