首页 | 本学科首页   官方微博 | 高级检索  
     

高维数据相似性度量方法研究
作者姓名:谢明霞  郭建忠  张海波  陈科
作者单位:1. 解放军信息工程大学测绘学院,河南,郑州,450052;75719部队,湖北,武汉,430074
2. 解放军信息工程大学测绘学院,河南,郑州,450052
3. 68029部队,甘肃,兰州,730020
基金项目:国家科技支撑计划资助项目(2007BAH16B03);;国家863计划资助项目(2009AA12Z228)
摘    要:将低维空间中的距离度量方法(如Lk-范数)应用于高维空间时,随着维数的增加,对象之间距离的对比性将不复存在。研究高维数据有效的距离或相似(相异)度度量方法是一个重要且具有挑战性的课题。通过对传统的距离度量或相似性(相异性)度量方法在高维空间中表现出的不适应性的分析,并对现有的应用于高维数据的相似性度量方法进行总结,提出了高维数据相似性度量函数Hsim(X,Y)的改进方法HDsim(X,Y)。函数HDsim(X,Y)整合了各类型数据的相似性度量方法,在处理数值型、二值型以及分类属性数据上充分体现了原Hsim(X,Y)处理数值型数据、Jaccard系数处理二值数据以及匹配率处理分类属性数据的优越性。通过有效性及实例分析,充分论证了HDsim(X,Y)在高维空间中的有效性。

关 键 词:高维数据  相似性度量  属性相似性  空间相似性
收稿时间:2009-11-15
修稿时间:2010-02-09
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号