基于改进K-Means聚类和误差反馈的数据清洗方法 |
| |
引用本文: | 韩帅,孙乐平,杨艺云,吴宛潞,郭小璇,戴承承.基于改进K-Means聚类和误差反馈的数据清洗方法[J].电网与水力发电进展,2020,36(7):9-15. |
| |
作者姓名: | 韩帅 孙乐平 杨艺云 吴宛潞 郭小璇 戴承承 |
| |
作者单位: | 1. 广西电网有限责任公司电力科学研究院;2. 广西电网有限责任公司崇左供电局 |
| |
基金项目: | 南方电网公司科技项目(GXKJXM20180201) |
| |
摘 要: | 综合能源数据的采集与分析是构建综合能源系统的基础和前提,由于数据采集过程中存在系统故障、线路检修等随机因素的制约,其数据常存在异常和缺失情况。为解决上述问题,提出了基于改进K-Means聚类和误差反馈的数据清洗方法,对异常数据进行识别和插补。将异常数据分为不符合用能业务特性的坏数据和缺失数据两类。针对坏数据问题,提出了基于改进K-Means聚类的异常数据识别方法,其中采用Davies-Bouldin(DB)指标解决聚类数K的选取问题;针对缺失数据问题,提出了基于误差反馈的异常数据组合式插补方法。为验证所提方法的有效性,从某园区5个用户4个月的用电数据中选取40组数据,前20组作为样本集以确定插补权重,后20组作为验证集进行验证与对比,结果表明,所提方法具有更高的稳定性与可靠性。
|
关 键 词: | 综合能源系统 异常数据识别 数据插补 |
A Data Cleaning Method Based on Improved K-Means Clustering and Error Feedback |
| |
Authors: | HAN Shuai SUN Leping YANG Yiyun WU Wanlu GUO Xiaoxuan DAI Chengcheng |
| |
Abstract: | |
| |
Keywords: | |
|
| 点击此处可从《电网与水力发电进展》浏览原始摘要信息 |
|
点击此处可从《电网与水力发电进展》下载全文 |