基于BERT和LDA模型的酒店评论文本挖掘 |
| |
引用本文: | 綦方中,田宇阳.基于BERT和LDA模型的酒店评论文本挖掘[J].计算机应用与软件,2023(7):71-76+90. |
| |
作者姓名: | 綦方中 田宇阳 |
| |
作者单位: | 浙江工业大学管理学院 |
| |
基金项目: | 国家社科基金项目(18BJY148); |
| |
摘 要: | 通过主题模型对酒店评论文本进行文本挖掘,有利于引导酒店管理者和客户对评论信息做出合适的鉴别和判断。提出一种基于预训练的BERT语言模型与LDA主题聚类相结合的方法;利用中文维基百科语料库训练BERT模型并从中获取文本向量,基于深度学习算法对评论文本进行情感分类;通过LDA模型对分类后的文本进行主题聚类,分别获取不同情感极性文本的特征主题词,进而挖掘出酒店客户最为关注的问题,并对酒店管理者提出具有参考价值的建议。实验结果表明,通过BERT模型获取的文本向量在情感分类任务中表现较好,且BERT-LDA文本挖掘方法能使酒店评论文本的主题更具表达性。
|
关 键 词: | BERT LDA主题模型 情感分类 文本挖掘 酒店评论 |
|
|