首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到12条相似文献,搜索用时 125 毫秒
1.
基于网格熵的边界点检测算法   总被引:1,自引:0,他引:1  
为了快速有效地检测聚类的边界点,提出了网格熵的概念和基于网格熵的边界点检测算法Greb。该算法利用网格熵的大小来判定聚类的边界点,且只对数据集进行两遍扫描。实验结果表明,对含有任意形状、不同大小以及不同密度且带有噪声的数据集,该算法能快速有效地检测出聚类的边界点。  相似文献   

2.
一种高效的基于联合熵的边界点检测算法   总被引:1,自引:1,他引:0  
为了快速有效地检测出聚类的边界点,提出一种将网格技术与联合熵相结合的边界点检测算法.该算法中网格技术用于快速查找数据集中聚类边界所在的网格范围,联合熵用于在边界落入的网格范围内准确识别聚类的边界点.实验结果表明.该算法能够在含有噪声点,孤立点的数据集上,有效地检测出聚类的边界,运行效率高.  相似文献   

3.
无参数聚类边界检测算法的研究   总被引:1,自引:0,他引:1       下载免费PDF全文
邱保志  许敏 《计算机工程》2011,37(15):23-26
为自动快速地提取聚类的边界点,减少输入参数对边界检测结果的影响,提出一种无参数聚类边界检测算法。该算法不需要任何参数,在生成的三角剖分图上计算每个数据点的边界度,用k-means自动计算边界度阈值,按边界度阈值将数据集划分为候选边界点和非候选边界点两部分,根据噪声点在三角剖分图中的性质去除候选边界点中的噪声点,最终检测出边界点。实验结果表明,该算法能快速、有效地识别任意形状、不同大小和密度聚类的边界点。  相似文献   

4.
基于变异系数的边界点检测算法   总被引:2,自引:0,他引:2  
为有效检测聚类的边界点,提出基于变异系数的边界点检测算法.首先计算出数据对象到它的k-距离邻居距离之和的平均值.然后用平均值的倒数作为每个点的密度,通过变异系数刻画数据对象密度分布特征寻找边界点.实验结果表明,该算法可在含有任意形状、不同大小和不同密度的数据集上快速有效检测出聚类的边界点,并可消除噪声.  相似文献   

5.
为有效地检测噪声数据集上聚类的边界点,提出一种新的边界模式检测算法Green(Gravity-Based Boundary Points Detecting Algorithm),该算法将数据集中的对象看成是空间中带质量的点,利用牛顿力学对对象进行受力分析并计算每个点的边界因子,根据边界点具有较大的边界因子这一事实提取出边界点.实验结果表明:Green能在含有不同形状、大小簇的噪声数据集上有效地检测出聚类的边界点,执行效率高.  相似文献   

6.
为有效地检测聚类的边界点,提出基于统计信息的边界模式检测算法。根据数据对象的k距离统计信息设定邻域半径,再利用对象邻域范围内邻居的k距离统计信息寻找边界点。实验结果表明,该算法可以有效地检测出任意形状、不同大小和不同密度聚类的边界点,并可以消除噪声。  相似文献   

7.
为快速有效地检测聚类的边界点,提出了一种新的基于三角剖分的聚类边界检测算法DTBOUND。该算法通过计算三角剖分图中每个数据点的变异系数将数据集分解成内部点和外部点两部分,然后从每一个未分类的内部点开始进行深度优先遍历,将相连的内部点以及和内部点相连的外部点作为一个聚类;最后从得到的聚类中提取边界点。该算法只有一个参数(变异系数阈值β),实验结果表明该算法可以快速、有效地识别任意形状、不同大小和不同密度的聚类和聚类的边界点。  相似文献   

8.
为了快速有效的检测聚类的边界点,提出基于网格核密度的自适应边界点检测算法ADAPT(An Adaptive Grid Kernel-Density-Based BoundaryPoints Detecting Algorithm for Spatial Database with Noise),使用网格核密度更精确地拟合网格在其邻域内的密度,采用自适应选取网格近邻策略更好地反应对象的空间分布特征.实验结果表明:该算法可以在含有任意形状、不同大小和不同密度的数据集上快速有效地检测出聚类的边界点.  相似文献   

9.
网格聚类中的边界处理技术   总被引:4,自引:0,他引:4  
提出利用限制性k近邻和相对密度的概念识别网格聚类边界点的技术,给出网格聚类中的边界处理算法和带边界处理的网格聚类算法(GBCB).实验表明,聚类边界处理技术精度高,能有效地将聚类的边界点和孤立点/噪声数据分离开来.基于该边界处理技术的网格聚类算法GBCB能识别任意形状的聚类.由于它只对数据集进行一遍扫描,算法的运行时间是输入数据大小的线性函数,可扩展性好.  相似文献   

10.
边界剥离聚类算法(BP)是一种基于密度的聚类算法,它通过逐渐剥离边界点来揭示聚类的潜在核心,已经被证明是一种十分有效的聚类手段.然而, BP算法仍存在一些不足之处:一方面,数据点的局部密度仅考虑了距离特征,使得边界点的确定不够合理;另一方面, BP算法中的关联策略容易误判异常值,并且在分配边界点时容易产生连带错误.为此,本文提出了一种基于共享近邻和优化关联策略的边界剥离聚类算法(SOBP).该算法使用了基于共享近邻的局部密度函数来更好地探索数据点之间的相似性,同时优化了BP算法中的关联策略,使得每次迭代中边界点不再仅与一个非边界点进行关联,并进一步采用了边界点与非边界点、已剥离边界点之间的双重关联准则.在一些数据集上的测试表明,相较于其他6种经典算法,该算法在评估指标上表现更佳.  相似文献   

11.
分类数据的聚类边界检测技术   总被引:1,自引:0,他引:1  
邱保志  王波 《计算机应用》2012,32(6):1654-1656
随着分类属性数据集的应用越来越广泛,获取含有分类属性数据集的聚类边界的需求也越来越迫切。为了获取聚类的边界,在定义分类数据的边界度和聚类边界的基础上,提出了一种带分类属性数据的聚类边界检测算法——CBORDER。该算法首先利用随机分配初始聚类中心和边界度对类进行划分并获取记录边界点的证据,然后运用证据积累的思想多次执行该过程来获取聚类的边界。实验结果表明,CBORDER算法能有效地检测出高维分类属性数据集中聚类的边界。  相似文献   

12.

Data points situated near a cluster boundary are called boundary points and they can represent useful information about the process generating this data. The existing methods of boundary points detection cannot differentiate boundary points from outliers as they are affected by the presence of outliers as well as by the size and density of clusters in the dataset. Also, they require tuning of one or more parameters and prior knowledge of the number of outliers in the dataset for tuning. In this research, a boundary points detection method called BPF is proposed which can effectively differentiate boundary points from outliers and core points. BPF combines the well-known outlier detection method Local Outlier Factor (LOF) with Gravity value to calculate the BPF score. Our proposed algorithm StaticBPF can detect the top-m boundary points in the given dataset. Importantly, StaticBPF requires tuning of only one parameter i.e. the number of nearest neighbors \((k)\) and can employ the same \(k\) used by LOF for outlier detection. This paper also extends BPF for streaming data and proposes StreamBPF. StreamBPF employs a grid structure for improving k-nearest neighbor computation and an incremental method of calculating BPF scores of a subset of data points in a sliding window over data streams. In evaluation, the accuracy of StaticBPF and the runtime efficiency of StreamBPF are evaluated on synthetic and real data where they generally performed better than their competitors.

  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号