基于互信息的无监督特征选择 |
| |
引用本文: | 徐峻岭, 周毓明, 陈 林, 徐宝文. 基于互信息的无监督特征选择[J]. 计算机研究与发展, 2012, 49(2): 372-382. |
| |
作者姓名: | 徐峻岭 周毓明 陈林 徐宝文 |
| |
作者单位: | 1(东南大学计算机科学与工程学院 南京 210096) 2(计算机软件新技术国家重点实验室(南京大学) 南京 210093) 3(南京大学计算机科学与技术系 南京 210093) (junlingxu@gmail.com) |
| |
基金项目: | 国家自然科学基金,国家"八六三"高技术研究发展计划基金,国家"九七三"重点基础研究发展计划基金 |
| |
摘 要: | 在数据分析中,特征选择可以用来降低特征的冗余,提高分析结果的可理解性和发现高维数据中隐藏的结构.提出了一种基于互信息的无监督的特征选择方法(UFS-MI),在UFS-MI中,使用了一种综合考虑了相关度和冗余度的特征选择标准UmRMR(无监督最小冗余最大相关)来评价特征的重要性.相关度和冗余度分别使用互信息来度量特征与潜在类别变量之间的依赖和特征与特征之间的依赖.UFS-MI同时适用于数值型和非数值型特征.在理论上证明了UFS-MI的有效性,实验结果也表明UFS-MI可以达到与传统的特征选择方法相当甚至更好的性能.
|
关 键 词: | 特征选择 无监督特征选择 互信息 最小冗余-最大相关 无监督最小冗余-最大相关 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《计算机研究与发展》浏览原始摘要信息 |
|
点击此处可从《计算机研究与发展》下载免费的PDF全文 |
|