首页 | 本学科首页   官方微博 | 高级检索  
     

用双层减样法优化大规模SVM垃圾标签检测模型*
引用本文:覃希,苏一丹.用双层减样法优化大规模SVM垃圾标签检测模型*[J].计算机应用研究,2011,28(6):2095-2098.
作者姓名:覃希  苏一丹
作者单位:1. 广西工学院,计算机工程系,广西,柳州,545006;广西大学,计算机与电子信息学院,南宁,530004
2. 广西大学,计算机与电子信息学院,南宁,530004
基金项目:广西工学院自然科学基金资助项目(院科自1074011)
摘    要:针对支持向量机在训练大规模数据集时出现的速度瓶颈问题,提出一种新的减样方法,称双层减样法。数据减样时,双层减样法从粗、细粒度两个层次削减样本。粗粒度约减时,利用核空间距离聚类法,以簇为单位削减冗余子集。细粒度约减时,以点为单位挑选剩余点集中的支持向量。实验表明,双层减样法能有效的压缩样本数据,同时还能放大数据集的分类特征,提高分类器的分类精度。将此法应用于大规模SVM垃圾标签检测模型的训练集优化上,能明显提高检测模型的训练速度。双层减样法是将“粒度”和“层次”的概念引入减样法中,在约减时适时改变约减幅度。这比传统减样法更具有优势。

关 键 词:Folksonomy  垃圾标签  支持向量机  双层减样法  约减
收稿时间:2010/11/14 0:00:00
修稿时间:12/3/2010 4:59:53 PM

Double-layer reduction method optimizes large scale SVM social spam detection model
QIN Xi,SU Yi-dan.Double-layer reduction method optimizes large scale SVM social spam detection model[J].Application Research of Computers,2011,28(6):2095-2098.
Authors:QIN Xi  SU Yi-dan
Affiliation:(1.Dept. of Computer Engineering, Guangxi University of Technology, Liuzhou Guangxi 545006, China; 2.School of Computer & Electronics Information, Guangxi University, Nanning 530004, China)
Abstract:In order to improve the low efficiency of large-scale SVM,this paper presented a new samples reduction method,called double-layer reduction method.It reduced data in two levels.The first level was coarse-grained reduction.It deleted the redundant clusters with KDC reduction.The second level was fine-grained reduction.It picked out the support vectors from the clusters remained by SMO.The experiments show that double-layer reduction method gives a higher compression ratio and accuracy.It applied the new meth...
Keywords:Folksonomy  social spam  SVM  double-layer reduction method  reduce
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号