首页 | 本学科首页   官方微博 | 高级检索  
     

聚类分析中的差异性度量方法研究
引用本文:蒋盛益,李庆华. 聚类分析中的差异性度量方法研究[J]. 计算机工程与应用, 2005, 41(11): 146-149
作者姓名:蒋盛益  李庆华
作者单位:衡阳师范学院计算机系,湖南,衡阳,421008;华中科技大学计算机学院,武汉,430074;华中科技大学计算机学院,武汉,430074
基金项目:国家自然科学基金项目(编号:60273075)
摘    要:距离与差异性度量是聚类分析中的基本概念,是许多聚类算法的核心内容。在经典的聚类分析中,度量差异性的指标是距离的简单函数。该文针对混合属性数据集,提出两种距离定义,将差异性度量推广成为距离、类大小等因素的多元函数,使得原来只适用于数值属性或分类属性数据的聚类算法可用于混合属性数据。实验结果表明新的距离定义和差异性度量方法可提高聚类的质量。

关 键 词:距离  差异性  聚类
文章编号:1002-8331-(2005)11-0146-04

Research on Dissimilarity for Clustering Analysis
Jiang Shengyi,Li Qinghua. Research on Dissimilarity for Clustering Analysis[J]. Computer Engineering and Applications, 2005, 41(11): 146-149
Authors:Jiang Shengyi  Li Qinghua
Affiliation:Jiang Shengyi 1,2 Li Qinghua 21
Abstract:The distance and dissimilarity are basic concepts in clustering analysis.In classical clustering analysis,the dissimilarity is only simple function of distance.This paper propose s two distance definitions for attribute-mixed dataset,and generalizes dissimilarity to multi-function of distance and cluster size,the new distance and dissimilarity definitions make existed clustering algorithms for numerical attribute or categorical attribute can be used to attribute-mixed dataset.The experimental results show that the new distance and dissimilarity definitions can improve clustering quality.
Keywords:distance  dissimilarity  clustering  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号