首页 | 本学科首页   官方微博 | 高级检索  
     

基于BERT和LDA模型的酒店评论文本挖掘
作者姓名:綦方中  田宇阳
作者单位:浙江工业大学管理学院 浙江 杭州 310023
基金项目:国家社科基金项目(18BJY148);
摘    要:通过主题模型对酒店评论文本进行文本挖掘,有利于引导酒店管理者和客户对评论信息做出合适的鉴别和判断.提出一种基于预训练的BERT语言模型与LDA主题聚类相结合的方法;利用中文维基百科语料库训练BERT模型并从中获取文本向量,基于深度学习算法对评论文本进行情感分类;通过LDA模型对分类后的文本进行主题聚类,分别获取不同情感极性文本的特征主题词,进而挖掘出酒店客户最为关注的问题,并对酒店管理者提出具有参考价值的建议.实验结果表明,通过BERT模型获取的文本向量在情感分类任务中表现较好,且BERT-LDA文本挖掘方法能使酒店评论文本的主题更具表达性.

关 键 词:BERT  LDA主题模型  情感分类  文本挖掘  酒店评论
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号