首页 | 本学科首页   官方微博 | 高级检索  
     

基于LDA和TF-IDF的关键词提取算法研究
作者姓名:苏婧琼  苏艳琼
作者单位:1. 晋中信息学院;2. 山西大学
基金项目:2022年山西省高等学校科技创新计划各类项目“基于LDA模型的文本表示及关键词提取研究”(课题编号:2022L665);
摘    要:在自然语言处理领域,对于海量的文本文件,让用户在最短的时间找到到自己感兴趣的文档,最关键的工作是要每篇文档的关键词提取出来。而不管是针对一篇长文章或是一篇短文章,通常能够直接通过这几个关键字去窥探出整篇文章背后的主题思想。文章分别介绍了LDA主题模型和TFIDF算法在关键词提取中的应用,并进行了对比,结果表明在关键词提取方面都可以取得较好的效果。

关 键 词:LDA主题模型  TFIDF算法  关键词提取
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号