首页 | 本学科首页   官方微博 | 高级检索  
     

一种非均匀分布数据的非线性标准化方法
引用本文:梁路,黎剑,霍颖翔,滕少华. 一种非均匀分布数据的非线性标准化方法[J]. 计算机科学, 2016, 43(4): 264-269
作者姓名:梁路  黎剑  霍颖翔  滕少华
作者单位:广东工业大学计算机学院 广州510006,广东工业大学计算机学院 广州510006,广东工业大学计算机学院 广州510006,广东工业大学计算机学院 广州510006
基金项目:本文受国家863计划重大项目(2013AA01A212),国家自然科学基金资助
摘    要:传统的数据标准化处理通常采用的是线性的变换方法,其在处理非均匀分布的数据集时,容易因局部区间内数据点间距过小导致后续的数据挖掘(尤其是基于距离的挖掘)结果不够精确。因此,为非均匀分布数据提出一种基于数据拟合的非线性变换标准化方法,该方法能够在不改变数据整体分布规律的前提下,依据统计找出对应的非线性变换函数,根据函数对各数据点的取值进行非线性放缩,将数据稠密的区间进行扩大的同时将数据稀疏的区间进行压缩,让挖掘的结果更加精确。实验采用BP(Back Propagation)神经网络、支持向量机(Support Vector Machine,SVM)、最近邻分类(K-Nearest Neighbor,KNN) 3种经典分类算法结合不同的数据集进行了挖掘,结果表明,分类的错误率有不同程度的下降,同时F1度量有所提高。

关 键 词:非均匀分布  非线性标准化  数据预处理
收稿时间:2015-03-26
修稿时间:2015-07-24

Nonlinear Normalization for Non-uniformly Distributed Data
LIANG Lu,LI Jian,HUO Ying-xiang and TENG Shao-hua. Nonlinear Normalization for Non-uniformly Distributed Data[J]. Computer Science, 2016, 43(4): 264-269
Authors:LIANG Lu  LI Jian  HUO Ying-xiang  TENG Shao-hua
Affiliation:School of Computer Science and Technology,Guangdong University of Technology,Guangzhou 510006,China,School of Computer Science and Technology,Guangdong University of Technology,Guangzhou 510006,China,School of Computer Science and Technology,Guangdong University of Technology,Guangzhou 510006,China and School of Computer Science and Technology,Guangdong University of Technology,Guangzhou 510006,China
Abstract:
Keywords:Non-uniform distribution  Nonlinear normalization  Data preprocessing
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号