共查询到20条相似文献,搜索用时 812 毫秒
1.
空间同位模式挖掘是空间数据挖掘中一种重要的方法。空间同位模式是指在地理空间中,由于空间接近性而频繁的聚集在一起的空间特征的集合。提出了一种基于KD树的同位模式挖掘算法,算法可以分为两个基本步骤:邻域的确认和同位模式的剪枝过程。最后通过实验表明了算法的准确性与全面性。 相似文献
2.
空间分类数据同位规则挖掘算法 总被引:3,自引:0,他引:3
针对空间分类数据的特性,提出一种空间分类数据同位规则挖掘算法.利用空间关系定义数据挖掘中事务的概念,采用多层参与索引搜索空间同位规则,从而实现了对空间分类数据的有效处理.采用文中算法对杭州地区119火灾数据进行实验,并验证了该算法的适用范围和性能.实验表明,该算法可以有效地处理经过离散化后的连续数据. 相似文献
3.
4.
周剑云 《数字社区&智能家居》2015,(4):82-85,89
空间同位模式挖掘研究主要以区域划分为基础,考虑对象实例两两之间的距离关系,这样挖掘出的同位模式是双向对称的。但区域的划分起止位置不确定,可能出现由于区域划分的不一致而得到不一样的空间同位模式结果。该文提出以指定对象为核心的空间同位模式挖掘,这样不必担心区域划分的起止位置对挖掘结果的影响,而且更能有针对性地发现特定空间对象与其它哪些对象具有空间同位关系。 相似文献
5.
6.
7.
一种基于兴趣度的大型数据库关联规则挖掘方法 总被引:1,自引:0,他引:1
数据库关联规则挖掘是数据挖掘研究中一个重要研究课题,但该方法本身存在不足,对于大型数据库,可能产生数以千计的规则,使用户感到无所适从.本文提出对关联规则进行分类的思想,并给出了基于数据统计特性的带兴趣度的关联规则挖掘算法GRMiner和IRMiner,算法实现简单,分析表明该算法是有效的. 相似文献
8.
二进制挖掘算法在空间数据挖掘中的应用 总被引:1,自引:0,他引:1
现有的传统关联规则挖掘算法构建频繁候选项的方式和修剪技术是其应用于空间数据挖掘的技术难题.针对空间数据挖掘中数据库的属性特点,将基于二进制的挖掘算法应用于空闻数据挖掘中.该算法用二进制的逻辑运算产生频繁候选项和计算支持数,有效地解决了现有挖掘算法在空间数据库中提取关联规则时存在的难题. 相似文献
9.
一种基于事务压缩的关联规则优化算法 总被引:10,自引:0,他引:10
张素兰 《计算机工程与设计》2006,27(18):3450-3453
通过对Apriori算法挖掘过程进行分析,提出了一种基于事务压缩的关联规则挖掘算法.该算法充分利用Apriori性质,通过减少候选集的组合和减少数据库的扫描来提高挖掘的速度和减少数据库的I/O操作时间的开销,有效提高了关联规则的挖掘效率.并在Apriori算法的基础上设计了Apriori改进算法. 相似文献
10.
曹静 《计算机光盘软件与应用》2012,(16):170-171
经典Apriori关联规则挖掘算法需要多次扫描整个事务数据库,产生庞大的候选集。文章提出基于Apriori的IOIR算法,算法根据用户的兴趣,有选择的挖掘数据库,并通过对每个候选集进行支持数排序,从而减少扫描的数据量和扫描的时间。 相似文献
11.
空间co-location(并置)模式是指实例在空间中频繁关联的一组空间特征的子集.在空间数据挖掘中,现有算法主要针对的是正模式的挖掘,而空间中还存在着具有强负相关性的模式,如负co-location模式,这类模式的挖掘在一些应用中同样具有重要的意义.现有的负co-location模式挖掘算法的时间复杂度较高,挖掘到的... 相似文献
12.
空间co-location模式是一组空间特征的子集,它们的实例在邻域内频繁并置出现。通常,空间co-location模式挖掘方法假设空间实例相互独立,并采用空间实例参与到模式实例的频繁性(参与率)来度量空间特征在模式中的重要性,采用空间特征的最小参与率(参与度)来度量模式的有趣程度,忽略了空间特征间的某些重要关系。因此为了揭示空间特征间的主导关系而提出主导特征co-location模式。现有主导特征模式挖掘方法是基于传统频繁模式及其团实例模型进行挖掘,然而,团实例模型可能会忽略非团的空间特征间的主导关系。因此,基于星型实例模型,研究空间亚频繁co-location模式的主导特征挖掘,以更好地揭示空间特征间的主导关系,挖掘更有价值的主导特征模式。首先,定义了两个度量特征主导性的指标;其次,设计了有效的主导特征co-location模式挖掘算法;最后,在合成数据集和真实数据集上通过大量实验验证了所提算法的有效性以及主导特征模式的实用性。 相似文献
13.
空间极大co-location模式挖掘研究 总被引:1,自引:0,他引:1
空间co-location模式代表了一组空间特征的子集,它们的实例在空间中频繁地关联。挖掘空间co-location模式的研究已经有很多,但是针对极大co-location模式挖掘的研究非常少。提出了一种新颖的空间极大co-location模式挖掘算法。首先扫描数据集得到二阶频繁模式,然后将二阶频繁模式转换为图,再通过极大团算法求解得到空间特征极大团,最后使用二阶频繁模式的表实例验证极大团得到空间极大co-location频繁模式。实验表明,该算法能够很好地挖掘空间极大co-location频繁模式。 相似文献
14.
空间Co-Location模式挖掘是空间数据挖掘的一个重要研究方向,正受到越来越多的关注。在实际应用中,空间特征不仅包含空间信息,还经常伴随着属性信息,这些属性信息对决策和知识发现有重要意义。然而现有的Co-Location挖掘方法只强调特征的空间信息,忽略了其属性信息。基于对属性信息的模糊化处理,定义了模糊特征和模糊Co-Location模式等概念。类似于传统空间Co-Location模式挖掘中的相关概念,定义了模糊Co-Location模式的表实例和参与度等概念。在证明模糊Co-Location模式的向下闭合性质的基础上,设计了一个基本挖掘算法。为提高算法的可伸缩性,提出了两个剪枝方法。在合成的和真实的数据集上进行了大量实验,验证了基本算法及其改进算法的效果和效率。 相似文献
15.
空间Co-location模式是一组在空间中频繁并置的空间特征的子集。空间Co-location模式挖掘通常假设空间实例之间相互独立,然而,在实际应用中,不同空间特征、不同实例之间往往相互作用或依赖。空间Co-location关键特征是指对模式具有主导作用的特征。在频繁模式中,识别含关键特征的Co-location模式并摘取模式中的关键特征,为用户提供更精简的挖掘结果,提高Co-location模式的可用性,对Co-location模式挖掘具有重要意义。本文首先定义了含有关键特征的显著频繁Co-location模式新概念,以及一系列度量指标以识别显著频繁Co-location模式中的关键特征;其次,给出了一个挖掘显著频繁Co-location模式和关键特征的算法;最后,在模拟和真实数据集上进行了大量的实验,验证了所提出算法的效果及性能。 相似文献
16.
空间并置(co-location)模式是指其实例在空间邻域内频繁共现的空间特征集的子集。现有的空间co-location模式挖掘的有趣性度量指标,没有充分地考虑特征之间以及同一特征的不同实例之间的差异;另外,传统的基于数据驱动的空间co-location模式挖掘方法的结果常常包含大量无用或是用户不感兴趣的知识。针对上述问题,提出一种更为一般的研究对象--带效用值的空间实例,并定义了新的效用参与度(UPI)作为高效用co-location模式的有趣性度量指标;将领域知识形式化为三种语义规则并应用于挖掘过程中,提出一种领域驱动的多次迭代挖掘框架;最后通过大量实验对比分析不同有趣性度量指标下的挖掘结果在效用占比和频繁性两方面的差异,以及引入基于领域知识的语义规则前后挖掘结果的变化情况。实验结果表明所提出的UPI度量是一种兼顾频繁和效用的更为合理的度量指标;同时,领域驱动的挖掘方法能有效地挖掘到用户真正感兴趣的模式。 相似文献
17.
18.
19.
空间并置(co-location)模式是指其特征的实例在地理空间中频繁并置出现的一组空间特征的集合。传统co-location模式挖掘通常由用户给定一个邻近阈值来确定实例的邻近关系,使用单一的邻近阈值来判定两个空间实例的邻近性可能会造成邻近关系的缺失,也没有考虑距离大小的不同对邻近关系的影响。同时,传统方法主要利用频繁性阈值来衡量模式的频繁性,存在着算法效率对频繁性阈值较为敏感的问题。由于频繁并置的特征间具有较高的邻近度,因此利用聚类算法可以将其聚集在一起,加之邻近以及特征间的并置都是模糊的概念,因此将模糊集理论与聚类算法相结合,研究了空间co-location模式挖掘中的模糊挖掘技术,在定义模糊邻近关系的基础上,定义了度量特征之间邻近度的函数,基于特征邻近度利用模糊聚类算法挖掘co-location模式,最后通过广泛的实验验证了提出方法的实用性、高效性及鲁棒性。 相似文献
20.
空间并置(co-location)模式挖掘旨在发现空间特征间的关联关系,是空间数据挖掘的重要研究方向。基于列计算的空间并置模式挖掘方法(CPM-Col算法)避开挖掘过程中最耗时的表实例生成操作,直接搜索模式的参与实例,成为当前高效的方法之一。然而,回溯法搜索参与实例仍是该方法的瓶颈,尤其在稠密数据和长模式下。为加速参与实例的搜索,充分利用CPM-Col算法搜索参与实例时得到的行实例,在不增加额外计算的前提下对CPM-Col算法进行两点改进。首先,将CPM-Col算法搜索到的行实例存储为部分表实例,利用子模式的部分表实例快速确定参与实例,避免了大量实例的回溯计算。其次,在CPM-Col算法获得一条行实例后,利用行实例的子团反作用于第一个特征,得到第一个特征的参与实例,避免了这些实例的回溯搜索。由此,提出了基于改进列计算的空间并置模式挖掘算法(CPM-iCol算法),并讨论了算法的复杂度、正确性和完备性。在合成数据和真实数据集上进行了实验,与经典的传统算法join-less和CPM-Col算法对比,CPM-iCol算法明显降低了挖掘的时间,减少了回溯的次数。实验结果表明,该算法比CPM-Col具有更好的性能和可扩展性,特别在稠密数据集中效果更加明显。 相似文献