基于改进随机森林算法的停电敏感用户分类 |
| |
作者姓名: | 谢国荣 郑宏 林伟圻 徐鸣 郭昆 陈基杰 |
| |
作者单位: | 国网信通亿力科技有限责任公司,福州,350001;国网福建省电力有限公司电力科学研究院客户服务中心,福州,350003;福州大学数学与计算机科学学院,福州350116;福建省网络计算与智能信息处理重点实验室,福州350116 |
| |
基金项目: | 国家自然科学基金(61300104,61300103,61672158);福建省高校杰出青年科学基金(JA12016);福建省高等学校新世纪优秀人才支持计划(JA13021);福建省杰出青年科学基金(2014J06017,2015J06014);福建省科技创新平台计划(2009J1007,2014H2005);福建省自然科学基金(2013J01230,2014J01232);福建省高校产学合作项目(2014H6014,2017H6008);海西政务大数据应用协同创新中心 |
| |
摘 要: | 目前,我国电网企业对于识别停电投诉风险,开展用户停电敏感程度分析的研究工作还处在起步阶段.为了有效地分析停电用户的敏感程度,提出了一种基于改进随机森林算法的停电敏感用户分类算法.首先,对原始数据进行清洗、特征选择等预处理;接着,采用SMOTE算法增加少数敏感用户样本数据量,解决数据分布不均匀问题;然后,以Fisher比作为特征的重要性度量,按比例随机采样选取具有代表性的特征构成子特征空间;最后,利用随机森林算法识别停电敏感用户.通过在真实停电数据上的实验,验证了提出的方法不仅具有较好的准确性和时间性能,而且可以有效处理高维、冗余特征的数据.
|
关 键 词: | 停电敏感度分类 随机森林 不平衡数据 SMOTE算法 Fisher准则 |
收稿时间: | 2018-08-20 |
修稿时间: | 2018-09-18 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《计算机系统应用》浏览原始摘要信息 |
|
点击此处可从《计算机系统应用》下载免费的PDF全文 |
|