首页 | 本学科首页   官方微博 | 高级检索  
     

基于模拟退火的多标记数据特征选择
引用本文:张永波,游录金,陈杰新.基于模拟退火的多标记数据特征选择[J].计算机工程与设计,2011,32(7):2494-2496,2500.
作者姓名:张永波  游录金  陈杰新
作者单位:1. 浙江旅游职业学院图书信息中心,浙江杭州,311231
2. 上海思备计算机有限公司,上海,200030
3. 宁波城市职业技术学院信息中心,浙江宁波,315100
基金项目:国家自然科学基金项目(61005006)
摘    要:多标记数据有很多的冗余特征和数据,为了解决多标记数据中冗余和无关特征,提高多标记学习算法的泛化能力。提出一个基于模拟退火的卷积式特征选择方法——SAML(simulated annealing based feature selection for multi-label data),已有的算法只是使用了遗传算法来进行优化,新算法采用模拟退火来寻找最优子集,其效果在已有的工作中表现出比前者遗传算法更好的效果。在用于公开评测的Yahoo网页分类数据集上的实验结果表明,SAML算法的性能优于新近提出的一些流行的多标记特征选择方法。

关 键 词:多标记学习  特征选择  模拟退火  维数约简  YAHOO网页

Feature selection for multi-label data by using simulated annealing
ZHANG Yong-bo,YOU Lu-jin,CHENJie-xin.Feature selection for multi-label data by using simulated annealing[J].Computer Engineering and Design,2011,32(7):2494-2496,2500.
Authors:ZHANG Yong-bo  YOU Lu-jin  CHENJie-xin
Affiliation:ZHANG Yong-bo1,YOU Lu-jin2,CHEN Jie-xin3(1.Library and Information Center,Zhejiang College of Tourism,Hangzhou 311231,China,2.Shanghai Sibei Computer Company,Shanghai 200030,3.Information Center,Ningbo City College of Technology,Ningbo 315100,China)
Abstract:There are many redundant features in the data sets,in order to remove the irrelevant and redundant features in the multi-label data and further to improve the generalization performance of multi-label learning algorithms,simulated annealing based feature selection for multi-label data(SAML) is proposed,which employs the simulated annealing algorithm to search the optimal subsets.We know simulated annealing algorithm perform better than genetic algorithm.Experiments on Yahoo web page categorization data sets...
Keywords:multi-label learning  feature selection  simulated annealing  dimension reduction  Yahoo web  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号