期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

黄永平邹力鹍《计算机工程与应用》2004,40(29):206-208,225

数据仓库为数据挖掘提供了很好的平台,当数据仓库中的数据发生变化时,原来挖掘出来的模式也要相应地进行更新。MartinEster等最先提出了增量聚类算法,但算法在增量聚类过程中,更新对象依次一个个地单独处理,而没有考虑更新对象之间的关系,效率较低。该文提出了基于DBSCAN算法的批量增量聚类算法,减少了对象的检索,提高了增量聚类的效率。相似文献

2.

基于数据流的聚类趋势分析算法

樊仲欣《计算机应用》2020,40(8):2248-2254

聚类趋势分析算法基于抽样原理导致聚类趋势指标不稳定和片面,而且不适应数据流的批量增量特性,因而需要重复进行聚类趋势指数计算。为此,基于全体数据进行整体分析,提出一种基于最小距离连通图（MDCG）的聚类趋势分析算法MDCG-CTI。首先,利用栈的深度优先遍历法更新增量数据的最邻近路径从而降低MDCG的建立复杂度;然后,计算聚类趋势指数并确定可聚类性的判定阈值;最后,将所提算法和批量增量的具有噪声的基于密度的聚类方法（DBSCAN）相结合。在自定义数据集上的实验表明,该算法比现有算法对单簇和含大量噪点的数据的可聚类性判断更为精确;而在大数据集pendigits和avila上,所提算法比基于谱方法的聚类趋势可视化分析（SpecVAT）累计耗时降低了38%和42%,且相较SpecVAT结合批量增量DBSCAN,该算法结合批量增量DBSCAN的聚类平均准确率分别提高了6%和11%,聚类累计耗时则分别降低了7%和8%。实验结果表明该算法可以准确无参地判断聚类趋势,并明显提高增量聚类的有效性和运行效率。相似文献

3.

一种基于密度的快速聚类算法 总被引：52，自引：0，他引：52

周水庚周傲英曹晶胡运发《计算机研究与发展》2000,37(11):1287-1292

聚类是数据挖掘领域中的一个重要研究方向,聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用,迄今为止人们提出了许多用于大规模数据库的聚类算法。基于密度的聚类算法DBSCAN就是一个典型代表。以DBSCAN为基础,提出了一种基于密度的快速聚类算法。新算法以核心对象领域中所有对象的代表对象为种子对象来扩展类,从而减少区域查询次数,降低I/O开销,实现快速聚类,对二维空间数据测试表明：快速算法能够有效地对大规模数据库进行聚类,速度上数倍于已有DBSCAN算法。相似文献

4.

基于DBSCAN的批量更新聚类算法

下载免费PDF全文

易宝林伍仪强丰大洋张小莉《计算机工程》2009,35(2):63-64,6

为更新批量数据,提出一种基于DBSCAN的新聚类方法。该算法通过扫描原对象确定它们同增量对象间的关系,得到一个相关对象集,同时根据该相关对象和增量对象之间的关系获得新的聚类结果。实验结果表明,该算法与DBSCAN是等价的,能更有效地解决批量数据更新时的增量聚类问题。相似文献

5.

一个改进的基于DBSCAN的空间聚类算法研究 总被引：2，自引：0，他引：2

李杰贾瑞玉张璐璐《计算机技术与发展》2007,17(1):114-116

DBSCAN是一个基于密度的聚类算法。该算法将具有足够高密度的区域划分为簇，并可以在带有“噪声”的空间数据库中发现任意形状的聚类。但DBSCAN算法没有考虑非空间属性，且DBSCAN算法需扫描空间数据库中每个点的ε-邻域来寻找聚类，这使得DBSCAN算法的应用受到了一定的局限。文中提出了一种基于DBSCAN的算法，可以处理非空间属性，同时又可以加快聚类的速度。相似文献

6.

基于数据取样的DBSCAN算法 总被引：14，自引：1，他引：13

周水庚范晔周傲英《小型微型计算机系统》2000,21(12):1270-1274

取类是数据挖掘领域中的一个重要研究课题。聚类技术在许多领域有着广泛的应用,基于密度的聚类算法DBSCAN是一种有效的空间聚类算法,它能够发现任意形状的类并且有效地处理噪声,用户只需输入一个参数就可以进行聚类分析,但是,DBSCAN算法在对大规模空间数据库进行聚类分析时需要较大的内存支持和I/O消耗。本文在分析DBSCAN算法不足的基础上,提出一种基于数据取样的DBSCAN算法,使之能够有效地处理大规模空间数据库。二维空间数据测试结果表明本文算法是可行、有效的。相似文献

7.

基于数据分区的并行DBSCAN算法 总被引：1，自引：0，他引：1

何中胜刘宗田庄燕滨《小型微型计算机系统》2006,27(1):114-116

DBSCAN是基于密度的聚类算法的一个典型代表算法，它对空间数据库聚类有很好的性能．然而，在对大规模数据库聚类时，DBSCAN需要大量内存支持并伴随着I／O开销．随着高性能计算机的发展，特别是集群式计算机出现，给我们提供了一种解决DBSCAN算法缺陷的方法，本文提出一种建立在集群式高性能计算机上基于数据分区并行DBSCAN算法．测试结果表明，它极大地降低了DBSCAN对时间和空间的需要．相似文献

8.

一个改进的基于DBSCAN的空间聚类算法研究

李杰贾瑞玉张璐璐《微机发展》2007,17(1):114-116

DBSCAN是一个基于密度的聚类算法。该算法将具有足够高密度的区域划分为簇,并可以在带有“噪声”的空间数据库中发现任意形状的聚类。但DBSCAN算法没有考虑非空间属性,且DBSCAN算法需扫描空间数据库中每个点的ε-邻域来寻找聚类,这使得DBSCAN算法的应用受到了一定的局限。文中提出了一种基于DBSCAN的算法,可以处理非空间属性,同时又可以加快聚类的速度。相似文献

9.

基于局部半径的三支DBSCAN算法

申秋萍张清华高满代永杨《计算机科学》2023,(6):100-108

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种经典的基于密度的聚类算法，它通过两个全局参数即半径Eps和最少点数MinPts,能够对任意形状的数据进行聚类，并自动确定类个数。但是，使用全局半径的DBSCAN对于密度不均匀数据集的聚类效果较差，且无法对重叠数据集进行聚类。因此，定义了密度递减原则和局部半径，并根据k-近邻距离自动确定局部半径，从而提出了基于局部半径的DBSCAN算法(LE-DBSCAN);然后，通过考虑近邻的标签，对二支聚类结果的临界点和噪声点进行重新划分，从而提出了基于局部半径的三支DBSCAN算法(LE3W-DBSCAN)。将LE-DBSCAN和LE3W-DBSCAN与该领域的相关算法在UCI数据集和人工数据集上进行对比，实验结果表明，所提算法在常用的硬聚类指标和软聚类指标上都具有较好的表现。相似文献

10.

FDBSCAN:一种快速 DBSCAN算法 总被引：19，自引：0，他引：19

周水庚周傲英金文范晔钱卫宁《软件学报》2000,11(6):735-744

聚类分析是一门重要的技术 ,在数据挖掘、统计数据分析、模式匹配和图象处理等领域具有广泛的应用前景 .目前 ,人们已经提出了许多聚类算法 .其中 ,DBSCAN是一种性能优越的基于密度的空间聚类算法 .利用基于密度的聚类概念 ,用户只需输入一个参数 ,DBSCAN算法就能够发现任意形状的类 ,并可以有效地处理噪声 .文章提出了一种加快 DBSCAN算法的方法 .新算法以核心对象邻域中所有对象的代表对象为种子对象来扩展类 ,从而减少区域查询次数 ,降低 I/ O开销 .实验结果表明 ,FDBSCAN能够有效地相似文献