基于文本分类与语义识别的电力运营数据智能处理 |
| |
引用本文: | 马行星,左军辉,池俊.基于文本分类与语义识别的电力运营数据智能处理[J].电子设计工程,2023(9):104-108. |
| |
作者姓名: | 马行星 左军辉 池俊 |
| |
作者单位: | 国网新疆营销服务中心 |
| |
摘 要: | 针对当前电力运营数据分析和利用不足的现状,提出一种基于文本分类与语义识别的电力运营数据智能处理算法。该算法采用剔除异常文本、分词以及去停顿词等操作进行电力运营文本清洗,再使用连续词袋(CBOW)模型实现电力运营文本的向量化表示。同时利用Apriori算法挖掘电力运营文本向量与文本分类结果的关联规则,并基于小批量梯度下降(MBGD)的长短期记忆网络(LSTM)算法来获取电力运营文本分类的结果。通过对新疆电网某历史数据的仿真分析结果表明,文中所提算法相较于LSTM与Apriori-SVM算法,在电力运营文本分类上具有更高的准确率;且与传统梯度下降法相比,MBGD算法能够在保持较高准确率的同时大幅缩减模型的训练时间。
|
关 键 词: | 文本挖掘 Apriori 向量化表示 长短期记忆网络 |
|
|