基于多特征选择的电力档案自动分类方法 |
| |
引用本文: | 马宁,李瑞环.基于多特征选择的电力档案自动分类方法[J].信息与电脑,2023(10):19-21. |
| |
作者姓名: | 马宁 李瑞环 |
| |
作者单位: | 国网浙江省电力有限公司嵊州市供电公司 |
| |
摘 要: | 针对电力档案自动分类中应用效果不佳的问题,提出基于多特征选择的电力档案自动分类方法。首先,对电力档案文本内容进行提取、分词、去停词处理,并利用向量空间模型表示电力档案本文;其次,利用多特征选择技术提取文档频率、卡方检验、归一化差异、基尼指数及信息增益多项特征;最后,根据特征确定电力档案文档与类别的相似度,通过与分类阈值对比确定电力档案类别。实验结果表明,设计方法的档案错误分类数量较少,优于传统方法,在电力档案自动分类方面拥有广阔的应用前景。
|
关 键 词: | 多特征选择 电力档案 自动分类 |
|
|