首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 137 毫秒
1.
一种新的正负空间同位规则挖掘算法   总被引:1,自引:0,他引:1  
空间同位规则是一种新的空间数据挖掘方法.尽管人们对挖掘空间同位规则做了一些研究,但大多数研究者仅仅对正空间同位规则进行研究,没有考虑负空间同位规则.本文提出了一种新的正负空间同位规则挖掘算法(Positive and Negative Spatial Co-Location Rules Mining Algorithm,PNSCLRMA).为了减少计算量,算法利用了星形邻域去减少连接运算和定义兴趣度去删除不感兴趣的空间同位模式两项优化技术.实验表明,该算法有效可行.  相似文献   

2.
提出了集成聚类分析、凸包分析、叠置分析和面积计算等各种地理空间分析与计算方法,实现了一种对在线地理数据进行地理空间关联规则挖掘的算法.该算法对非空间数据的关联规则发现算法Apriori进行了空间化处理,使该算法能够进行空间数据挖掘,发现空间关联规则.实现了在线地理空间数据的空间关联规则挖掘程序,并采用实际数据对算法进行了检验,验证了它们的可用性与有效性,并对挖掘所得的空间关联规则进行了多种可视化表达.从实验效果来看,空间关联规则的支持度和准确度主要依赖数据空间特征,如长度、面积(选择的计算基准)、体积等,发现了一些有趣的空间关联信息.  相似文献   

3.
基于贝叶斯粗糙集,引入贝叶斯区分矩阵,采用属性的出现频率与属性的长度作为启发因素,并以此给出了贝叶斯粗糙集属性约简的另外一种算法,最后提出了一种基于颜色特征的图像分类模型及其分类算法。用该方法进行图像资源的分类,克服了经典粗糙集不宜处理带有噪声的数据和决策表不协调的分类问题的缺陷,同时又大大简化分类规则,且形成的规则集便于用户理解。完善了近似空间的概念。实验结果表明在处理决策表不协调的图像分类问题,贝叶斯粗糙集方法性能良好,分类准确和高效。  相似文献   

4.
针对MLKNN算法仅对独立标签进行处理,忽略现实世界中标签之间相关性这一问题,提出了一种基于关联规则的MLKNN多标签分类算法(FP-MLKNN)。该算法采用关联规则算法挖掘标签之间的高阶相关性,并用标签之间的关联规则改进MLKNN算法,以达到提升分类性能的目的。首先,使用MLKNN算法求样本的特征置信度;采用关联规则算法挖掘生成一系列强关联规则,进而将2种算法进行融合来构造多标签分类器,对新标签进行预测;在此基础上,将本文提出的算法与MLKNN、AdaBoostMH和BPMLL这3种算法进行实验对比。实验结果表明,本文所提算法在yeast、emotions和enron数据集上的分类性能均优于这3种算法,具有较好的分类效果。  相似文献   

5.
CBA算法是将关联规则挖掘与分类技术相结合的一种分类算法,在许多领域中得到了广泛应用.针对CBA处理海量数据效率低的缺点,提出了一个改进的CBA算法.该算法将粗糙集理论应用到CBA算法中,对决策表进行属性约简,提高了分类关联规则的生成效率;并应用PEP(pessimistic error pruning)方法对候选规则进行剪裁.实验结果表明,该算法比CBA具有更高的分类效率和准确度.  相似文献   

6.
李俊林 《控制与决策》2010,25(4):507-514
目前,很多基于核密度估计的数据分类算法采用的判别规则忽视了不平衡类问题.对此,提出了改进的基于核密度估计的数据分类算法.该算法可处理不平衡类带来的影响,并在不平衡类问题严重时也能发挥好的效果,而且可以推广到多分类问题.实验结果表明了这种改进是非常有效的,它提高了基于核密度估计的分类算法对不平衡类的适应力.  相似文献   

7.
在对基本人工鱼群算法原理分析的基础上,提出了一种多群协同人工鱼群算法用于实现对连续空间变量的分类规则提取问题。定义了基于规则支持度与置信度的规则评价函数,构造了人工鱼在规则提取应用中的特定编码及相关概念的计算公式,给出了该算法的具体实现步骤,并用VC++软件编程实现。最后对Iris和Wine数据集进行测试实验,并与单群体鱼群算法及多种群微粒群算法进行比较。仿真结果表明,该算法能够快速提取分类精度较高的分类规则,因此利用该算法解决连续变量分类规则提取的相关问题是可行且有效的。  相似文献   

8.
空间数据库中约束K最接近对查询   总被引:1,自引:0,他引:1  
定义了满足空间约束的K最接近对查询,该查询检索两个数据集在给定约束区域中的K最接近对。在空间数据库中,对采用R树类型索引存储的数据集给出了三个查询处理算法。其中两阶段的RJ和JR算法采用了变换范围查询和最接近对查询执行顺序的策略。单阶段基于堆的SPH算法采用了最好优先的策略,并利用给出的裁减规则、更新规则和访问顺序规则来提高查询处理效率。实验表明SPH具有较好的适用性和性能。  相似文献   

9.
针对数据分类挖掘问题,利用并行思想,提出一种基于并行反向熵决策树算法的人工神经网络.通过概率度量水平生成并行决策树对数据进行粗处理,以加快人工神经网络的分析速度.随后采用一组仿真数据对该方法进行测试和评估.实验结果表明,该并行分类方法比单个决策树具有更高的分类精度,并在保持分类结果良好可解释性的基础上优化了分类规则.  相似文献   

10.
Parepinelli等人提出了基于ACO的分类算法。算法实质上是一种序列覆盖算法:蚁群搜索一个规则,移去它覆盖的样例,再重复这一过程.从而得到共同覆盖样例的一组规则。针对蚁群算法计算时间长的缺点,文章采用了新的启发函数及信息素更斯方法,并引入了精英群交叉变异策略。对两个功用数据的实验及其和Ant—Miner的对比表明,该算法有更强的预测分析能力,能够发现更好的分类规则集?以及形式更简单的规则。实验同时显示该算法有效节约了时间。  相似文献   

11.
With the evolution of geographic information capture and the emergency of volunteered geographic information, it is getting more important to extract spatial knowledge automatically from large spatial datasets. Spatial co-location patterns represent the subsets of spatial features whose objects are often located in close geographic proximity. Such pattern is one of the most important concepts for geographic context awareness of location-based services (LBS). In the literature, most existing methods of co-location mining are used for events taking place in a homogeneous and isotropic space with distance expressed as Euclidean, while the physical movement in LBS is usually constrained by a road network. As a result, the interestingness value of co-location patterns involving network-constrained events cannot be accurately computed. In this paper, we propose a different method for co-location mining with network configurations of the geographical space considered. First, we define the network model with linear referencing and refine the neighborhood of traditional methods using network distances rather than Euclidean ones. Then, considering that the co-location mining in networks suffers from expensive spatial-join operation, we propose an efficient way to find all neighboring object pairs for generating clique instances. By comparison with the previous approaches based on Euclidean distance, this approach can be applied to accurately calculate the probability of occurrence of a spatial co-location on a network. Our experimental results from real and synthetic data sets show that the proposed approach is efficient and effective in identifying co-location patterns which actually rely on a network.  相似文献   

12.
Spatial co-location pattern discovery without thresholds   总被引:2,自引:0,他引:2  
Spatial co-location pattern mining discovers the subsets of features whose events are frequently located together in geographic space. The current research on this topic adopts a threshold-based approach that requires users to specify in advance the thresholds of distance and prevalence. However, in practice, it is not easy to specify suitable thresholds. In this article, we propose a novel iterative mining framework that discovers spatial co-location patterns without predefined thresholds. With the absolute and relative prevalence of spatial co-locations, our method allows users to iteratively select informative edges to construct the neighborhood relationship graph until every significant co-location has enough confidence and eventually to discover all spatial co-location patterns. The experimental results on real world data sets indicate that our framework is effective for prevalent co-locations discovery.  相似文献   

13.
空间Co-location模式是一组在空间中频繁并置的空间特征的子集。空间Co-location模式挖掘通常假设空间实例之间相互独立,然而,在实际应用中,不同空间特征、不同实例之间往往相互作用或依赖。空间Co-location关键特征是指对模式具有主导作用的特征。在频繁模式中,识别含关键特征的Co-location模式并摘取模式中的关键特征,为用户提供更精简的挖掘结果,提高Co-location模式的可用性,对Co-location模式挖掘具有重要意义。本文首先定义了含有关键特征的显著频繁Co-location模式新概念,以及一系列度量指标以识别显著频繁Co-location模式中的关键特征;其次,给出了一个挖掘显著频繁Co-location模式和关键特征的算法;最后,在模拟和真实数据集上进行了大量的实验,验证了所提出算法的效果及性能。  相似文献   

14.
俞庆英  罗永龙  吴倩  陈传明 《计算机应用》2016,36(11):3113-3117
针对现有的co-location模式挖掘算法无法有效处理不均匀分布空间对象的问题,提出一种不均匀模糊空间对象的分层次co-location模式挖掘方法。首先提出一种不均匀数据集的生成方法;然后对不均匀分布的数据集进行层次划分,使每个区域具有均匀的空间分布;再基于改进的PO_RI_PC算法对划分后的模糊对象进行空间数据挖掘。该方法基于距离变化系数构建每个子区域的邻域关系图,进而完成区域融合,实现co-location模式挖掘。实验结果表明,与传统方法相比,所提方法的执行效率更高,随实例个数和不均匀度的变化获得的co-location集个数更多,同比情况下平均提高约25%,获得了更精确的挖掘结果。  相似文献   

15.
空间并置(co-location)模式挖掘是指在大量的空间数据中发现一组空间特征的子集,这些特征的实例在地理空间中频繁并置出现.传统的空间并置模式挖掘算法通常采用逐阶递增的挖掘框架,从低阶模式开始生成候选模式并计算其参与度(空间并置模式的频繁性度量指标).虽然这种挖掘框架可以得到正确和完整的结果,但是带来的时间和空间开...  相似文献   

16.
A spatial co-location pattern represents relationships between spatial features that are frequently located in close proximity to one another. Such a pattern is one of the most important concepts for geographic context awareness of ubiquitous Geographic Information System (GIS). We constructed a framework for co-location pattern mining using the transaction-based approach, which employs maximal cliques as a transaction-type dataset; we first define transaction-type data and verify that the definition satisfies the requirements, and we also propose an efficient way to generate all transaction-type data. The constructed framework can play a role as a theoretical methodology of co-location pattern mining, which supports geographic context awareness of ubiquitous GIS.  相似文献   

17.
An order-clique-based approach for mining maximal co-locations   总被引:2,自引:0,他引:2  
Most algorithms for mining spatial co-locations adopt an Apriori-like approach to generate size-k prevalence co-locations after size-(k − 1) prevalence co-locations. However, generating and storing the co-locations and table instances is costly. A novel order-clique-based approach for mining maximal co-locations is proposed in this paper. The efficiency of the approach is achieved by two techniques: (1) the spatial neighbor relationships and the size-2 prevalence co-locations are compressed into extended prefix-tree structures, which allows the order-clique-based approach to mine candidate maximal co-locations and co-location instances; and (2) the co-location instances do not need to be stored after computing some characteristics of the corresponding co-location, which significantly reduces the execution time and space required for mining maximal co-locations. The performance study shows that the new method is efficient for mining both long and short co-location patterns, and is faster than some other methods (in particular the join-based method and the join-less method).  相似文献   

18.
空间极大co-location模式挖掘研究   总被引:1,自引:0,他引:1  
空间co-location模式代表了一组空间特征的子集,它们的实例在空间中频繁地关联。挖掘空间co-location模式的研究已经有很多,但是针对极大co-location模式挖掘的研究非常少。提出了一种新颖的空间极大co-location模式挖掘算法。首先扫描数据集得到二阶频繁模式,然后将二阶频繁模式转换为图,再通过极大团算法求解得到空间特征极大团,最后使用二阶频繁模式的表实例验证极大团得到空间极大co-location频繁模式。实验表明,该算法能够很好地挖掘空间极大co-location频繁模式。  相似文献   

19.
选址问题是任何一个商业机构都要面临的重大决策问题之一,它受多种因素制约,比如社会经济学、地质学、生态学以及决策者的特定需求等。现有的选址方法(通常被经济学家采用)大多利用主观评价,可扩展性差。空间co-location模式挖掘是空间数据挖掘的一个重要研究方向。一个频繁co-location模式是一组空间特征的子集,它们的实例在空间中频繁关联。利用co-location模式的这种特征间“共存”关系,提出了一种基于co-location模式的地址选择算法,该算法基于本体描述空间数据的分类信息,并在本体的指导下对用户感兴趣的兴趣点(Point of Interest)进行关键co-location模式挖掘,同时针对实际情况对数据进行了预处理以增加算法的有效性。在真实数据集(北京市的兴趣点数据)上的评估实验显示该算法具有较高的准确率,选择的地址具有高可靠性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号