首页 | 本学科首页   官方微博 | 高级检索  
     

密度偏差抽样技术在聚类算法中的应用研究
引用本文:余波 朱东华 刘嵩 郑涛. 密度偏差抽样技术在聚类算法中的应用研究[J]. 计算机科学, 2009, 36(2): 207-209
作者姓名:余波 朱东华 刘嵩 郑涛
作者单位:北京理工大学管理与经济学院,北京,100081;北京理工大学管理与经济学院,北京,100081;北京理工大学管理与经济学院,北京,100081;北京理工大学管理与经济学院,北京,100081
基金项目:国家自然科学基金重点项目,面向21世纪教育振兴行动计划(985计划),教育部新世纪优秀人才支持计划 
摘    要:针对在大规模数据集上进行聚类困难的问题,分析了抽样技术的优点,研究了数据挖掘领域中的随机抽样的特点,并在此基础上提出了一种基于密度的偏差抽样方法.利用密度偏差抽样所获得的样本数据集能够较准确地反映总体数据集的特征,并且能够灵活地控制对数据集不同区域的抽样率.实验证明,在大规模数据集上进行聚类时,密度偏差抽样在时间复杂度上要优于随机抽样.

关 键 词:数据挖掘  聚类  偏差抽样  随机抽样
收稿时间:2008-03-20

Applied Research on Clustering Algorithm Using Density Biased Sampling Technology
YU Bo,ZHU Dong-hu,LIU Song,ZHENG Tao (School of Management and Economics,Beijing Institute of Technology,Beijing,China. Applied Research on Clustering Algorithm Using Density Biased Sampling Technology[J]. Computer Science, 2009, 36(2): 207-209
Authors:YU Bo  ZHU Dong-hu  LIU Song  ZHENG Tao (School of Management  Economics  Beijing Institute of Technology  Beijing  China
Affiliation:School of Management and Economics;Beijing Institute of Technology;Beijing 100081;China
Abstract:The advantages of sampling technology were analyzed against the difficulties of clustering on large-scale data set,and study the traits of random sampling in data mining were studied then a biased sampling method based on density was presented.The sample data set using density biased sampling can more accurately reflect the character of the whole data set,and biased sampling can control the sampling rate freely as to different part of the data set.The experimental results show that,density biased sampling i...
Keywords:Data mining  Clustering  Biased sampling  Random sampling  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号