首页 | 本学科首页   官方微博 | 高级检索  
     

SVM中不平衡数据的分离超平面的校正方法
引用本文:刘万里,刘三阳.SVM中不平衡数据的分离超平面的校正方法[J].计算机工程与应用,2008,44(19):169-171.
作者姓名:刘万里  刘三阳
作者单位:洛阳师范学院 数学科学学院,河南 洛阳 471022
摘    要:针对两类不平衡数据的分离超平面的偏移问题提出一种平衡方法。首先,对两类样本数据在核空间中进行核主成分分析,分别求出两类样本数据的在特征空间中的主要特征值;然后,根据两样本容量以及各自的特征值所提供的信息,对两类数据给出惩罚因子比例;最后,通过优化训练,产生一个新的分离超平面。该分类面校正了标准的支持向量机的分类误差。实验显示了所提出方法的有效性,即与标准的支持向量机相比,不仅平衡了错分率而且还能减少错分率。

关 键 词:不平衡数据  核主成分分析  支持向量机  偏移  
收稿时间:2007-9-28
修稿时间:2008-1-21  

Revising method for separation hyperplane of imbalanced data in SVM
LIU Wan-li,LIU San-yang.Revising method for separation hyperplane of imbalanced data in SVM[J].Computer Engineering and Applications,2008,44(19):169-171.
Authors:LIU Wan-li  LIU San-yang
Affiliation:Department of Mathematics,Luoyang Normal College,Luoyang,Henan 471022,China
Abstract:A balance method for the offset of separation hyperplane of biclassification imbalanced data is proposed.Firstly,the principal eigenvalues are found respectively of the two classes of samples in feature space by using Kernel Principal Component Analysis(KPCA).Secondly,one penalty proportion is given based on the information provided by the sizes of the two sample data and their eigenvalues.Finally,a new separation hyperplane is generated by the optimization training.The hyperplane revises the error of the standard Support Vector Machines.Experiments show the efficiency of proposed method,i.e.comparing with standard Support Vector Machines the classification error can be balanced and be also decreased.
Keywords:imbalanced data  Kernel Principal Component Analysis(KPCA)  Support Vector Machines(SVM)  offset
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号