首页 | 本学科首页   官方微博 | 高级检索  
     

一种聚簇消减大规模数据的支持向量分类算法
引用本文:陈光喜,徐健,成彦.一种聚簇消减大规模数据的支持向量分类算法[J].计算机科学,2009,36(3):184-188.
作者姓名:陈光喜  徐健  成彦
作者单位:1. 桂林电子科技大学数学与计算科学学院,桂林,541004
2. 安徽财经大学统计与应用数学学院,蚌埠,233030
基金项目:国家自然科学基金,桂电软环境项目 
摘    要:针对支持向量分类机对大规模数据集训练速度慢的瓶颈,提出一种聚簇消减数据集方法.首先建立样本中心距离函数,计算聚簇集的比例半径,然后利用聚簇集镜像扫描样本点确定簇集类,同一类样本特性的聚簇集中只保留代表样本点,建立异类点删除矩阵,通过上述方法消减样本集.证明了这种簇消减算法有较低的时间复杂度,并利用实验说明了保留代表点的有效意义.最后通过随机数据和UCI标准数据库验证了算法在保证分类精度的同时提高了分类速度.

关 键 词:支持向量机  聚簇集  大规模数据集  训练速度
收稿时间:2008/4/29 0:00:00

Cluster Method of Support Vector Machine to Solve Large-scale Data Set Classification
CHEN Guang-xi,XU Jian,CHENG Yan.Cluster Method of Support Vector Machine to Solve Large-scale Data Set Classification[J].Computer Science,2009,36(3):184-188.
Authors:CHEN Guang-xi  XU Jian  CHENG Yan
Affiliation:School of Mathematics & Computing Science;Guilin University of Electronic Technology;Guilin 541004;China;School of Statistics & Applied Mathematics;Anhui University of Finance & Economics;Bengbu 233030;China
Abstract:A cluster Support Vector Machines (C-SVM) method for large-scale data set classification was presented to accelerate speed.Firstly,using function of centre distance calculated radius ratio.Then,data set was scanned by cluster mirror.By remaining representative data for cluster and installing deleted matrix sample set was remarkably reduced.It is proved that the new method has lower time complexity.Experiments with random data and UCI databases verify the efficiency of the C-SVM.Moreover,classification accur...
Keywords:SVM  Cluster  Large-scale data set  Training speed  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号