首页 | 本学科首页   官方微博 | 高级检索  
     

高维数据相似性度量方法研究
引用本文:谢明霞,郭建忠,张海波,陈科.高维数据相似性度量方法研究[J].计算机工程与科学,2010,32(5):92-96.
作者姓名:谢明霞  郭建忠  张海波  陈科
作者单位:1. 解放军信息工程大学测绘学院,河南,郑州,450052;75719部队,湖北,武汉,430074
2. 解放军信息工程大学测绘学院,河南,郑州,450052
3. 68029部队,甘肃,兰州,730020
基金项目:国家科技支撑计划资助项目(2007BAH16B03);;国家863计划资助项目(2009AA12Z228)
摘    要:将低维空间中的距离度量方法(如Lk-范数)应用于高维空间时,随着维数的增加,对象之间距离的对比性将不复存在。研究高维数据有效的距离或相似(相异)度度量方法是一个重要且具有挑战性的课题。通过对传统的距离度量或相似性(相异性)度量方法在高维空间中表现出的不适应性的分析,并对现有的应用于高维数据的相似性度量方法进行总结,提出了高维数据相似性度量函数Hsim(X,Y)的改进方法HDsim(X,Y)。函数HDsim(X,Y)整合了各类型数据的相似性度量方法,在处理数值型、二值型以及分类属性数据上充分体现了原Hsim(X,Y)处理数值型数据、Jaccard系数处理二值数据以及匹配率处理分类属性数据的优越性。通过有效性及实例分析,充分论证了HDsim(X,Y)在高维空间中的有效性。

关 键 词:高维数据  相似性度量  属性相似性  空间相似性
收稿时间:2009-11-15
修稿时间:2010-02-09

Research on the Similarity Measurement  of High Dimensional Data
XIE Ming-xia,GUO Jian-zhong,ZHANG Hai-bo,CHEN Ke.Research on the Similarity Measurement  of High Dimensional Data[J].Computer Engineering & Science,2010,32(5):92-96.
Authors:XIE Ming-xia  GUO Jian-zhong  ZHANG Hai-bo  CHEN Ke
Affiliation:1.Institute of Surveying and Mapping/a>;Information Engineering University/a>;Zhengzhou 450052/a>;2.Corps 75719/a>;Wuhan 430074/a>;3.Corps 68029/a>;Lanzhou 730020/a>;China
Abstract:There exists no comparison between the distances of the objects with the increase of dimension when the method of distance measurement for low dimensional space is adopted in high dimensional space.The study of efficient methods for distance measurement or similarity(dissimilarity)measurement in high dimensional space is very important and challenging.The improved function HDsim(X,Y)is proposed to measure the similarity between the objects in high dimensional space through analyzing the inapplicability of t...
Keywords:high dimensional data  similarity measurement  attribute similarity  spatial similarity  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号