首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进K-Means聚类和误差反馈的数据清洗方法
引用本文:韩帅,孙乐平,杨艺云,吴宛潞,郭小璇,戴承承.基于改进K-Means聚类和误差反馈的数据清洗方法[J].电网与水力发电进展,2020,36(7):9-15.
作者姓名:韩帅  孙乐平  杨艺云  吴宛潞  郭小璇  戴承承
作者单位:1. 广西电网有限责任公司电力科学研究院;2. 广西电网有限责任公司崇左供电局
基金项目:南方电网公司科技项目(GXKJXM20180201)
摘    要:综合能源数据的采集与分析是构建综合能源系统的基础和前提,由于数据采集过程中存在系统故障、线路检修等随机因素的制约,其数据常存在异常和缺失情况。为解决上述问题,提出了基于改进K-Means聚类和误差反馈的数据清洗方法,对异常数据进行识别和插补。将异常数据分为不符合用能业务特性的坏数据和缺失数据两类。针对坏数据问题,提出了基于改进K-Means聚类的异常数据识别方法,其中采用Davies-Bouldin(DB)指标解决聚类数K的选取问题;针对缺失数据问题,提出了基于误差反馈的异常数据组合式插补方法。为验证所提方法的有效性,从某园区5个用户4个月的用电数据中选取40组数据,前20组作为样本集以确定插补权重,后20组作为验证集进行验证与对比,结果表明,所提方法具有更高的稳定性与可靠性。

关 键 词:综合能源系统  异常数据识别  数据插补

A Data Cleaning Method Based on Improved K-Means Clustering and Error Feedback
Authors:HAN Shuai  SUN Leping  YANG Yiyun  WU Wanlu  GUO Xiaoxuan  DAI Chengcheng
Abstract:
Keywords:
点击此处可从《电网与水力发电进展》浏览原始摘要信息
点击此处可从《电网与水力发电进展》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号