首页 | 本学科首页   官方微博 | 高级检索  
     

MMCKDE:基于数据流的m-混合聚类核概率密度估计
引用本文:许敏,邓赵红,王士同,史荧中. MMCKDE:基于数据流的m-混合聚类核概率密度估计[J]. 计算机研究与发展, 2014, 51(10)
作者姓名:许敏  邓赵红  王士同  史荧中
作者单位:1. 江南大学数字媒体学院 江苏无锡214122;无锡职业技术学院物联网技术学院 江苏无锡 214121
2. 江南大学数字媒体学院 江苏无锡214122
基金项目:国家自然科学基金项目,江苏省研究生创新工程项目
摘    要:数据流挖掘应用对时间、空间有着较高的要求,因而传统的密度估计方法,如核密度估计法、压缩集密度估计法等并不适用于数据流密度估计.提出一种新颖的面向在线数据流的m-混合聚类核密度估计(m-mixed clustering kernel density estimation,MMCKDE)方法,该方法通过创建MMCKDE节点,用固定个数的混合聚类核获得聚类信息,以代替其他密度估计方法中的所有核.针对数据量不断增加的情况,通过计算Kullback Leibler(KL)距离进行核合并,可进一步以更紧凑的形式表示概率密度估计信息.较之于其他一些方法只能估计整段数据流的密度,MMCKDE方法最终获得的模型不仅适用于整段数据流,还适用于任意时间段上的密度估计.MMCKDE算法同SOMKE算法在不同基准数据集及真实数据集上进行密度估计精度和运行时间的比较.实验结果表明,MMCKDE算法具有更好的性能.

关 键 词:m-混合聚类核  核密度估计  概率密度函数  Kullback Leibler距离  流数据挖掘

MMCKDE: m-Mixed Clustering Kernel Density Estimation over Data Streams
Xu Min,Deng Zhaohong,Wang Shitong,Shi Yingzhong. MMCKDE: m-Mixed Clustering Kernel Density Estimation over Data Streams[J]. Journal of Computer Research and Development, 2014, 51(10)
Authors:Xu Min  Deng Zhaohong  Wang Shitong  Shi Yingzhong
Abstract:
Keywords:m-mixed clustering kernel  kernel density estimation  probability density functions  Kullback Leibler (KL) divergence  streaming data mining
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号