高维数据相似性度量方法研究 |
| |
作者姓名: | 谢明霞 郭建忠 张海波 陈科 |
| |
作者单位: | 1. 解放军信息工程大学测绘学院,河南,郑州,450052;75719部队,湖北,武汉,430074 2. 解放军信息工程大学测绘学院,河南,郑州,450052 3. 68029部队,甘肃,兰州,730020 |
| |
基金项目: | 国家科技支撑计划资助项目(2007BAH16B03);;国家863计划资助项目(2009AA12Z228) |
| |
摘 要: | 将低维空间中的距离度量方法(如Lk-范数)应用于高维空间时,随着维数的增加,对象之间距离的对比性将不复存在。研究高维数据有效的距离或相似(相异)度度量方法是一个重要且具有挑战性的课题。通过对传统的距离度量或相似性(相异性)度量方法在高维空间中表现出的不适应性的分析,并对现有的应用于高维数据的相似性度量方法进行总结,提出了高维数据相似性度量函数Hsim(X,Y)的改进方法HDsim(X,Y)。函数HDsim(X,Y)整合了各类型数据的相似性度量方法,在处理数值型、二值型以及分类属性数据上充分体现了原Hsim(X,Y)处理数值型数据、Jaccard系数处理二值数据以及匹配率处理分类属性数据的优越性。通过有效性及实例分析,充分论证了HDsim(X,Y)在高维空间中的有效性。
|
关 键 词: | 高维数据 相似性度量 属性相似性 空间相似性 |
收稿时间: | 2009-11-15 |
修稿时间: | 2010-02-09 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《计算机工程与科学》浏览原始摘要信息 |
|
点击此处可从《计算机工程与科学》下载全文 |
|