首页 | 本学科首页   官方微博 | 高级检索  
     

基于LDA模型的新闻话题的演化
引用本文:楚克明,李芳. 基于LDA模型的新闻话题的演化[J]. 计算机应用与软件, 2011, 28(4)
作者姓名:楚克明  李芳
作者单位:上海交通大学计算机科学与工程系,上海,200240
基金项目:国家自然科学基金项目(60873134)
摘    要:
新闻话题及演化的研究可以帮助人们快速了解和获取新闻内容。提出了一种挖掘新闻话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化。首先应用LDA(Latent Dirichlet Allocation Model)对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意两个话题的分布距离实现话题的关联。实验结果证明该方法不但可以描述同一个话题随时间的演化过程,还可以描述话题内容随时间的变化,反映了话题(或子话题)之间多对多的演化关系。

关 键 词:潜在狄利克雷分配模型  话题关联  话题演化  

LDA MODEL-BASED NEWS TOPIC EVOLUTION
Chu Keming,Li Fang. LDA MODEL-BASED NEWS TOPIC EVOLUTION[J]. Computer Applications and Software, 2011, 28(4)
Authors:Chu Keming  Li Fang
Affiliation:Chu Keming Li Fang(Department of Computer Science and Engineering,Shanghai Jiaotong University,Shanghai 200240,China)
Abstract:
The study on news topic and its evolution can help people fast learn and acquire news events in reality.In this paper,we propose a method to discover topic's evolution over time and to realise topic evolution by topic extraction and topics relating.First the method applies LDA model on temporal news reports in different time periods to automatically extract news topics,the number of topics in different time periods can vary.Then it calculates the distributed distance of arbitrary two topics in adjacent time...
Keywords:Latent Dirichlet allocation(LDA) model Topic relevance Topic evolution  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号