首页 | 本学科首页   官方微博 | 高级检索  
     

基于免参数据挖掘的相异度度量研究
引用本文:文娟娟,柴玉梅. 基于免参数据挖掘的相异度度量研究[J]. 计算机应用, 2006, 26(12): 2982-2984
作者姓名:文娟娟  柴玉梅
作者单位:郑州大学,信息工程学院,河南,郑州,450052;郑州大学,信息工程学院,河南,郑州,450052
摘    要:由于参数设置导致数据挖掘结果异常的例子很多,为了解决这一问题,出现了免参数据挖掘思想。对Kolmogorov复杂度理论进行了研究,将其和免参数据挖掘思想相结合,提出了一种基于压缩的相异度度量SCDM。由于压缩算法是空间和时间高效性算法,使得应用该算法的相异度度量也具有较好的性能。实验表明将这种相异度度量应用到层次聚类算法中,其聚类的准确率也较高。

关 键 词:免参数据挖掘  Kolmogorov复杂度  压缩算法  相异度度量  层次聚类
文章编号:1001-9081(2006)12-2982-03
收稿时间:2006-06-19
修稿时间:2006-06-192006-08-23

Dissimilarity measure based on parameter-free data mining
WEN Juan-juan,CHAI Yu-mei. Dissimilarity measure based on parameter-free data mining[J]. Journal of Computer Applications, 2006, 26(12): 2982-2984
Authors:WEN Juan-juan  CHAI Yu-mei
Affiliation:School of Information and Engineering, Zhengzhou University, Zhengzhou Henan 450052, China
Abstract:There are many cases of getting fault results in data mining because of setting parameters. Therefore, parameter-free data mining appeared in order to resolve the problem. A new Compression-Based Dissimilarity Measure which was based on Kolmogorov complexity theory was proposed. Because compression algorithms are typically space and time efficient, the method based on it also has good performance. Applying it to hierarchical clustering can get good result.
Keywords:parameter-free data mining   Kolmogorov complexity   compression algorithm   dissimilarity measure  hierarchical clustering
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用》浏览原始摘要信息
点击此处可从《计算机应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号