首页 | 本学科首页   官方微博 | 高级检索  
     

高维数据空间的性质及度量选择
引用本文:何进荣,丁立新,胡庆辉,李照奎.高维数据空间的性质及度量选择[J].计算机科学,2014,41(3):212-217.
作者姓名:何进荣  丁立新  胡庆辉  李照奎
作者单位:武汉大学计算机学院软件工程国家重点实验室 武汉430072;武汉大学计算机学院软件工程国家重点实验室 武汉430072;武汉大学计算机学院软件工程国家重点实验室 武汉430072;武汉大学计算机学院软件工程国家重点实验室 武汉430072
基金项目:本文受中央高校基本科研业务费专项资金(2012211020209),广东省省部产学研结合专项(2011B090400477),珠海市产学研合作专项资金(2011A050101005,2012D0501990016),珠海市重点实验室科技攻关项目(2012D0501990026)资助
摘    要:高维数据分析是机器学习和数据挖掘研究中的主要内容,降维算法通过寻找数据表示的最优子空间来约减维数,在降低计算代价的同时,也提高了后续分类或者聚类算法的性能,从而成为高维数据分析的有效手段。然而,目前缺乏高维数据分析的理论指导。对高维数据空间的统计和几何性质进行了综述,从不同的角度给出了高维数据空间中"度量集中"现象的直观解释,并讨论了通过度量选择的方式来提高经典的基于距离度量的机器学习算法在分析高维数据时的性能。实验表明,分数距离度量方式可以显著提高K近邻和Kmeans算法的性能。

关 键 词:高维数据  维数灾难  度量集中
收稿时间:2013/5/19 0:00:00
修稿时间:2013/9/16 0:00:00

Properties of High-dimensional Data Space and Metric Choice
HE Jin-rong,DING Li-xin,HU Qing-hui and LI Zhao-kui.Properties of High-dimensional Data Space and Metric Choice[J].Computer Science,2014,41(3):212-217.
Authors:HE Jin-rong  DING Li-xin  HU Qing-hui and LI Zhao-kui
Affiliation:State Key Laboratory of Software Engineering,School of Computer,Wuhan University,Wuhan 430072,China;State Key Laboratory of Software Engineering,School of Computer,Wuhan University,Wuhan 430072,China;State Key Laboratory of Software Engineering,School of Computer,Wuhan University,Wuhan 430072,China;State Key Laboratory of Software Engineering,School of Computer,Wuhan University,Wuhan 430072,China
Abstract:
Keywords:High-dimensional data  Curse of dimensionality  Concentration of measure
本文献已被 CNKI 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号