首页 | 本学科首页   官方微博 | 高级检索  
     

一种话题演化建模与分析方法
引用本文:胡艳丽,白亮,张维明.一种话题演化建模与分析方法[J].自动化学报,2012,38(10):1690-1697.
作者姓名:胡艳丽  白亮  张维明
作者单位:1.国防科学技术大学信息系统工程重点实验室 长沙 410073
基金项目:国家自然科学基金(60902094,60903225,41001260);高等学校博士学科点专项科研基金(20114307110008)资助~~
摘    要:根据时序关系将文本流划分为连续时间片中的文本集, 在线抽取各时间片中隐含的子话题, 采用模型选择方法动态确定各时间片包含的子话题数, 以历史时间片的子话题信息作为当前子话题发现的先验知识, 基于 OLDA (Online latent Dirichlet allocation)模型抽取各时间片包含的子话题, 通过 Gibbs 抽样对话题模型参数进行估计; 对子话题进行关联分析, 定义子话题产生、消亡、继承、分裂和合并五种演化类型, 提出基于相对熵的子话题关联分析方法, 根据子话题语义相似度和时序关系建立子话题间的关联, 由具有时序关系和内容关联的子话题组成话题, 通过子话题内容和强度的变化描述话题演化. 基于真实网络新闻的话题演化分析实验表明, 本文提出的话题演化分析方法能够有效检测 网络新闻话题内容和强度的演化.

关 键 词:话题演化    OLDA  模型    模型选择    Gibbs  抽样    相对熵    关联分析
收稿时间:2011-5-13
修稿时间:2012-4-28

Modeling and Analyzing Topic Evolution
HU Yan-Li,BAI Liang,ZHANG Wei-Ming.Modeling and Analyzing Topic Evolution[J].Acta Automatica Sinica,2012,38(10):1690-1697.
Authors:HU Yan-Li  BAI Liang  ZHANG Wei-Ming
Affiliation:1.Science and Technology on Information Systems Engineering Laboratory, National University of Defense Technology, Changsha 410073
Abstract:Topic evolution of network public opinions is investigated. By treating topics as a set of correlated sub-topics, a topic evolution model is proposed, consisting of sub-topic detection and correlation analysis. Furthermore, a sub-topic detection algorithm based on OLDA is presented with Bayesian model selection for the appropriate topic numbers and parameters estimation via Gibbs sampling. The correlations are further defined for analysis of topic evolution, including emergence, extinction, development, merge and split of sub-topics. The method is experimentally verified to be efficient for detecting topic evolution of network public opinions.
Keywords:Topic evolution  online latent Dirichlet allocation (OLDA)  model selection  Gibbs sampling  relative entropy  correlation analysis
本文献已被 CNKI 等数据库收录!
点击此处可从《自动化学报》浏览原始摘要信息
点击此处可从《自动化学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号