首页 | 本学科首页   官方微博 | 高级检索  
     

用核K-means聚类和半定规划SVM实现垃圾标签检测
引用本文:覃 华,丁立朵,符丽锦,覃 希. 用核K-means聚类和半定规划SVM实现垃圾标签检测[J]. 计算机应用研究, 2013, 30(4): 1179-1182
作者姓名:覃 华  丁立朵  符丽锦  覃 希
作者单位:广西大学 计算机与电子信息学院, 南宁 530004
基金项目:国家自然科学基金资助项目(61063032); 国家教育部人文社会科学研究项目(11YJAZH080)
摘    要:提出使用核K-means聚类算法从样本集中抽取特征向量集来训练SVM,达到减少SVM规模的目的。SVM核函数的选择会影响SVM模型的分类效果,提出将多个非线性映射能力不同的核函数进行线性组合,在特征训练集上构造出组合SVM的半定规划模型,用内点法求解出最优组合系数,得到非线性映射能力更强的半定规划SVM,并用做垃圾标签检测。在UCI数据集上与双层减样支持向量机方法进行比较,实验结果表明,新的垃圾标签检测法提高了识别率,并大幅度减少了训练时间。

关 键 词:垃圾标签识别  支持向量机  多核函数组合  半定规划

Detecting tag spam in social tagging systems with kernel K-meansclustering and semi-definite programming SVM
QIN Hu,DING Li-duo,FU Li-jin,QIN Xi. Detecting tag spam in social tagging systems with kernel K-meansclustering and semi-definite programming SVM[J]. Application Research of Computers, 2013, 30(4): 1179-1182
Authors:QIN Hu  DING Li-duo  FU Li-jin  QIN Xi
Affiliation:School of Computer & Electronics Information, Guangxi University, Nanning Guangxi 530004, China
Abstract:This paper presented a method. It used kernel K-means clustering algorithm to extract the character vector set from the samples and got the optimal combinatorial coefficients of different functions to construct semi-definite programming SVM with stronger nonlinear mapping ability. Experimental results on UCI datasets show that compared with double-layer reduction method, the new method gives higher accuracy and speeds up obviously.
Keywords:tag spam detection   SVM   combination of multiple kernel functions   semi-definite programming
本文献已被 CNKI 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号