首页 | 本学科首页   官方微博 | 高级检索  
     

一类基于信息熵的多标签特征选择算法
引用本文:张振海,李士宁,李志刚,陈昊.一类基于信息熵的多标签特征选择算法[J].计算机研究与发展,2013,50(6).
作者姓名:张振海  李士宁  李志刚  陈昊
作者单位:西北工业大学计算机学院 西安 710072
基金项目:"核高基"国家科技重大专项基金项目
摘    要:在多标签分类问题中,特征选择是提升多标签分类器性能的一种重要手段.针对目前多标签特征选择算法计算复杂度大和无法给出一个合理的特征子集的问题,提出了一种基于信息熵的多标签特征选择算法.该算法假设特征之间相互独立,使用特征与标签集合之间的信息增益来衡量特征与标签集合之间的重要程度,并据此提出一种信息增益阈值选择方法.首先计算每一个特征与标签集合之间的信息增益,然后使用信息增益阈值选择算法得到一个合理的阈值,最后根据阈值删除不相关的特征,得到一组合理的特征子集.在2个不同分类器和4个多标签数据集上的实验结果表明:特征选择算法能够有效地提升多标签分类器的分类性能.

关 键 词:物联网  数据处理  信息论  多标签分类  特征选择  信息增益  特征降维

Multi-Label Feature Selection Algorithm Based on Information Entropy
Zhang Zhenhai , Li Shining , Li Zhigang , Chen Hao.Multi-Label Feature Selection Algorithm Based on Information Entropy[J].Journal of Computer Research and Development,2013,50(6).
Authors:Zhang Zhenhai  Li Shining  Li Zhigang  Chen Hao
Abstract:
Keywords:Internet of things  data processing  information theory  multi-label classification  feature selection  information gain  dimensionality reduction
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号