首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
空间同位模式挖掘是空间数据挖掘中一种重要的方法。空间同位模式是指在地理空间中,由于空间接近性而频繁的聚集在一起的空间特征的集合。提出了一种基于KD树的同位模式挖掘算法,算法可以分为两个基本步骤:邻域的确认和同位模式的剪枝过程。最后通过实验表明了算法的准确性与全面性。  相似文献   

2.
俞庆英  罗永龙  吴倩  陈传明 《计算机应用》2016,36(11):3113-3117
针对现有的co-location模式挖掘算法无法有效处理不均匀分布空间对象的问题,提出一种不均匀模糊空间对象的分层次co-location模式挖掘方法。首先提出一种不均匀数据集的生成方法;然后对不均匀分布的数据集进行层次划分,使每个区域具有均匀的空间分布;再基于改进的PO_RI_PC算法对划分后的模糊对象进行空间数据挖掘。该方法基于距离变化系数构建每个子区域的邻域关系图,进而完成区域融合,实现co-location模式挖掘。实验结果表明,与传统方法相比,所提方法的执行效率更高,随实例个数和不均匀度的变化获得的co-location集个数更多,同比情况下平均提高约25%,获得了更精确的挖掘结果。  相似文献   

3.
区域同位模式挖掘(RCPM, regional co-location pattern mining)是为了发掘某个局部区域内存在的同位(co-location)模式,以发现在全局中无法发现的信息.传统的区域挖掘大多会采用明确界限的几何体框定同位模式产生的区域.但是现实中的各类区域可能是无明确边界的.另外,数据的分布情况作为区域的重要特征之一,也应该成为区域选择的因素.基于上述思考,本文引入密度峰值聚类(DPC, density peak-based clustering),提出新的密度度量函数,并结合模糊集理论与k近邻距离,设计了一个行之有效的并行区域同位模式挖掘算法.实验结果表明,利用本文方法挖掘到的结果更具有现实意义,并且并行化极大地提升了挖掘算法的效率.在真实数据上, 2线程下的加速比达到了1.89.  相似文献   

4.
针对城市移动轨迹模式挖掘问题展开研究, 提出移动全局模式与移动过程模式相结合的挖掘方法, 即通过移动轨迹的起始位置点--终点位置点 (Origin-destination, OD点) 与移动过程序列分别进行移动全局模式与过程模式的发现. 在移动全局模式发现中, 提出了弹性多尺度空间划分方法, 避免了硬性等尺度网格划分对密集区域边缘的破坏, 同时增强了密集区域与稀疏区域的区分能力.在移动过程模式发现中, 提出了基于移动轨迹的路网拓扑关系模型构建方法, 通过路网关键位置点的探测抽取拓扑关系模型.最后基于空间划分集合与路网拓扑模型对原始 移动轨迹数据进行序列数据转换与频繁模式挖掘. 通过深圳市出租车历史 GPS 轨迹数据的实验结果表明, 该方法与现有方法相比在区域划分、数据转换等方面具有更好的性能, 同时挖掘结果语义更为丰富, 可解释性更强.  相似文献   

5.
一种新的正负空间同位规则挖掘算法   总被引:1,自引:0,他引:1  
空间同位规则是一种新的空间数据挖掘方法.尽管人们对挖掘空间同位规则做了一些研究,但大多数研究者仅仅对正空间同位规则进行研究,没有考虑负空间同位规则.本文提出了一种新的正负空间同位规则挖掘算法(Positive and Negative Spatial Co-Location Rules Mining Algorithm,PNSCLRMA).为了减少计算量,算法利用了星形邻域去减少连接运算和定义兴趣度去删除不感兴趣的空间同位模式两项优化技术.实验表明,该算法有效可行.  相似文献   

6.
空间分类数据同位规则挖掘算法   总被引:3,自引:0,他引:3  
针对空间分类数据的特性,提出一种空间分类数据同位规则挖掘算法.利用空间关系定义数据挖掘中事务的概念,采用多层参与索引搜索空间同位规则,从而实现了对空间分类数据的有效处理.采用文中算法对杭州地区119火灾数据进行实验,并验证了该算法的适用范围和性能.实验表明,该算法可以有效地处理经过离散化后的连续数据.  相似文献   

7.
空间Co_location模式挖掘关注空间对象实例在一定区域内同时出现的关系。目前大多数研究都是把空间对象的各个实例按同等权重对待,但现实中容易发现同一类对象的不同实例其大小规模、重要程度或是影响力覆盖范围都是不一样的。因此考虑空间对象实例的影响力因素,引入加权欧氏距离阈值参与计算,能发现更具实际价值的Co_location模式。  相似文献   

8.
空间co-location(并置)模式是一组空间特征的子集,其实例在空间中频繁地邻近出现.由于空间数据同时存在关联性和异质性,co-location模式实例的分布或在整个研究区域中全局出现(全局co-location模式),或在研究区域的局部区域出现(区域co-location模式),从而提出了多级co-location模式挖掘.当前的多级co-location模式挖掘方法存在两个问题:1)已有的多级co-location模式挖掘方法忽略了模式在空间中的分布特性,未能准确区分全局和区域co-location模式;2)已有的多级模式挖掘方法将全局非频繁co-location模式作为候选区域co-location模式,导致候选区域co-location模式数量过多.针对以上问题,首先,定义了模式的实例分布均匀系数,在考虑模式频繁性的同时考虑了模式在空间中的分布情况,从而正确、高效地识别出全局和区域co-location模式.其次,基于模式的实例分布均匀系数,设计了一个有效的多级co-location模式挖掘算法,提出了有效的剪枝策略以提高算法效率.最后,在真实和合成数据集上进行了广泛的实验,验证了所提方法的正确性和高效性.  相似文献   

9.
一种基于空间邻接关系的k-means聚类改进算法   总被引:3,自引:0,他引:3       下载免费PDF全文
王海起  王劲峰 《计算机工程》2006,32(21):50-51,75
空间对象不仅具有非空间的属性特征,而且具有与空间位置、拓扑结构相关的空间特征。利用传统的聚类方法对空间对象进行聚类时,由于没有考虑空间关系,同一类的对象可能出现在空间不相邻的位置。基于空间邻接关系的k-means改进算法将相邻对象的空间邻接关系作为约束条件加以考虑,使聚类结果既反映了属性特征的相似程度,又反映了对象的空间相邻状态,从而可以揭示不同类别对象的空间分布格局,因此其比传统的k-means方法更适合于空间对象的聚类分析。  相似文献   

10.
基于距离和基于密度的离群点检测算法受到维度和数据量伸缩性的挑战, 而空间数据的自相关性和异质性决定了以属性相互独立和分类属性的基于信息理论的离群点检测算法也难以适应空间离群点检测, 因此提出了基于全息熵的混合属性空间离群点检测算法。算法利用区域标志属性进行区域划分, 在区域内利用空间关系确定空间邻域, 并用R*-树进行检索。在此基础上提出了基于全息熵的空间离群度的度量方法和空间离群点挖掘算法, 有效解决了混合属性的离群度的度量和离群点的挖掘问题。由于实现区域划分有利于并行计算, 从而可适应大数据量的计算。理论和实验证明, 所提算法在计算效率和实验结果的可解释性方面均具有优势。  相似文献   

11.
实例位置模糊的空间co-location模式挖掘研究   总被引:2,自引:0,他引:2  
实例位置模糊在许多领域里都有着非常重要的应用,比如生物医学图像数据库和地理信息系统(geographic information system,GIS)。研究了实例位置模糊的空间co-location模式挖掘问题。定义了实例位置模糊的空间co-location模式挖掘的相关概念,包括实例位置模糊、位置参与率等;给出了基本算法来挖掘实例位置模糊的co-location模式;提出了两种改进算法,即基于网格的距离计算和减枝候选模式,以提高挖掘性能,加快co-location规则的产生。通过大量的实验,说明了基本算法及其改进算法的效果和效率。  相似文献   

12.
空间位置数据分布通常具有不均匀性,不同位置区域的密度差异较大,在本地差分隐私模型中无法直接获取用户真实的位置数据,使得空间位置划分方法受到限制以及数据发布存在查询精度低、通信代价大等问题。为在本地差分隐私模型下的大规模空间数据采集和发布过程中进行空间划分,提出一种空间数据分层自适应划分算法KDG-HT。通过收集部分用户的数据来初步获取区域的分布情况,采用KD-树的思想划分区域,并利用抽样技术对用户进行分组,根据分组用户统计结果所提供的先验知识来完成多层细粒度划分。在此基础上,结合差分隐私模型的并行组合特性分层扰动用户数据,从总体上实现发布数据的ε-差分隐私保护。实验结果表明,KDG-HT算法适用于具有不同数据分布情况的大规模空间数据集,查询精度及运行效率优于RAPPOR、UG、GT-R等算法,其中与GT-R算法相比,KDG-HT算法发布数据的查询精度最高提升3倍,运行效率提高17%。  相似文献   

13.
R-Tree及其变种的多维索引结构在数据的操作过程中通过对空间的分隔和不断调整将整个空间划分为大小不等的子空间以容纳足够的空间对象,这种方法能有效地实现多维空间对象的索引,但不能避免频繁的节点分裂与重组操作所造成的计算开销,也不能避免对叶子节点中的候选对象进行空间匹配所带来的计算开销。提出了一种能有效解决上述问题的索引结构:SHG-Tree。基于SHG-Tree的索引方法将多维空间划分为不同粒度的格子单元并将这些格子单元通过SHG-Tree按空间包含关系组织为层次树结构,同一层的格子互不相交且空间范围固定。空间对象通过文中提出的线性化方法转换为一系列不同粒度的互不相交的空间格子,进而将对象在其覆盖的格子中注册以实现空间对象至SHG-Tree的映射。查询操作只需将查询条件映射为相应的格子并取出这些格子中的对象作为查询结果。这种索引结构能有效减少节点的分裂和组合带来的计算开销,也解决了传统R-Tree索引中对于叶子节点中的候选对象进行区域匹配的计算开销。基于SHG-Tree的索引结构支持包括相交查询、区域查询、包含查询、top-N查询、k-NN查询等常用的多维查询,实验表明SHG-Tree能在毫秒级实现各种空间查询。  相似文献   

14.
在特定的空间分类任务中,对象的类别和自身属性相关较小,和近邻对象的空间特征相关较大,用传统的空间分类方法并不适用。提出一种基于co-location模式的空间分类挖掘算法。算法挖掘含不同类别特征的空间co-location模式,转化为分类规则,获得兴趣度较高的分类规则集。分类阶段先查询待分类对象的空间近邻,概化为空间特征,挑选适应的分类规则进行分类。实验结果表明这是一种高效的空间分类算法。  相似文献   

15.
在挖掘空间拓扑关联规则时,由于现有挖掘算法不能够提取满足用户特定需求的空间拓扑关联规则,若使用传统约束性关联规则挖掘算法,则存在大量的重复计算和冗余候选项;提出一种面向用户的空间拓扑关联规则挖掘算法,其适合在多空间关系模式下,挖掘满足用户特定需求的拓扑关联。该算法通过拓扑关系编码法将空间关系事务转换成整数,用非目标自由空间对象类的集合序列数值递增的方法,索引构建候选频繁项,并用布尔运算计算支持数。在挖掘满足用户特定需求的空间拓扑关联规则时,该算法是快速而有效的。  相似文献   

16.
空间co-location模式是一组空间特征的子集,它们的实例在邻域内频繁并置出现。通常,空间co-location模式挖掘方法假设空间实例相互独立,并采用空间实例参与到模式实例的频繁性(参与率)来度量空间特征在模式中的重要性,采用空间特征的最小参与率(参与度)来度量模式的有趣程度,忽略了空间特征间的某些重要关系。因此为了揭示空间特征间的主导关系而提出主导特征co-location模式。现有主导特征模式挖掘方法是基于传统频繁模式及其团实例模型进行挖掘,然而,团实例模型可能会忽略非团的空间特征间的主导关系。因此,基于星型实例模型,研究空间亚频繁co-location模式的主导特征挖掘,以更好地揭示空间特征间的主导关系,挖掘更有价值的主导特征模式。首先,定义了两个度量特征主导性的指标;其次,设计了有效的主导特征co-location模式挖掘算法;最后,在合成数据集和真实数据集上通过大量实验验证了所提算法的有效性以及主导特征模式的实用性。  相似文献   

17.
如何快速、方便、有效地分析不确定数据库中大量的不确定数据以发现潜在的、有价值的和人们感兴趣的信息变得越来越重要.空间co-location模式挖掘寻找给定空间对象之间的关联关系,是空间数据挖掘的重要研究方向.首先,定义了在不确定数据上挖掘空间co-location模式的可能世界模型,在此基础上定义了在可能世界模型下,空间co-location模式频繁度的测度:概率参与率.然后,设计了基于可能世界的U-Order-Clique-Based不确定空间co-location模式挖掘算法,并针对算法的指数级复杂度,讨论了优化策略.最后是实验评估,首先在模拟数据上验证了优化策略的效果,然后在真实数据上验证了研究存在不确定性co-location模式挖掘的现实意义.  相似文献   

18.
宫海彦  耿生玲 《计算机科学》2018,45(Z6):130-134
现有移动对象的轨迹预测大部分是针对路网空间,然而在实际地理环境中往往存在障碍物,移动对象的运动基本在障碍空间中进行。近年来,已有较多关于路网空间中移动对象轨迹预测的研究以及障碍空间中障碍范围查询、最近邻查询等的研究,但是目前尚没有障碍空间中移动对象不确定轨迹预测的相关研究。为此,提出障碍空间中基于移动对象运动规律的不确定轨迹预测方法。首先,利用障碍物之间的区域关系对障碍空间进行剪枝;其次,提出障碍空间期望距离概念,对障碍空间的轨迹数据进行轨迹聚类,从而挖掘移动对象的热点区域;然后,根据各热点区域间的障碍距离和历史访问习惯得到转移的综合概率,提出基于移动对象运动规律的轨迹预测算法;最后,通过实验验证了算法的准确性和高效性。  相似文献   

19.
吴成凤  蔡莉  李劲  梁宇 《计算机科学》2021,48(7):155-163
随着城市化进程的不断深入,居民出行频繁模式挖掘成为一个研究热点.然而,现有的研究存在一些问题,如缺乏对频繁模式发生的目的和意义的描述,以及对挖掘结果分析不全面等.针对这些问题,文中提出了一种新颖的居民出行频繁模式挖掘方法(Mining Method of Residents'Frequent Travel Patterns,MMoRFTP).首先,采用形态学图像方式将地图划分为多个区域,利用融合后的多源位置数据来构建出行模式,并采用主题模型识别每个区域的功能;然后,将缺乏语义信息的出行轨迹转化为具有区域和功能区语义的出行轨迹,并以区域为节点、语义轨迹为边构建居民出行模式图和标签模式图,在图模型构建的基础上提出MulEdge算法来挖掘区域之间由居民出行所形成的频繁关联模式.文中以城市路网数据、POI数据、出租车GPS数据和签到数据作为对象进行实验,结果表明MMoRFTP方法具有良好的性能,其发现的出行频繁模式能为道路规划、交通管理、商业布局等应用提供决策依据.  相似文献   

20.
多模式移动对象不确定性轨迹预测模型   总被引:5,自引:3,他引:2  
以移动设备、车辆、飞机、飓风等移动对象不确定性轨迹预测问题为背景,将大规模移动对象数据作为研究对象,以频繁轨迹模式挖掘、高斯混合回归技术为主要研究手段,提出多模式移动对象轨迹预测模型,关键技术包括:1)针对单一运动模式,提出一种基于频繁轨迹模式树FTP-tree的轨迹预测方法,利用基于密度的热点区域挖掘算法将轨迹点划分成不同的聚簇,构建轨迹频繁模式树,挖掘频繁轨迹模式预测移动对象连续运动位置.不同数据集上实验结果表明基于FTP-tree的轨迹预测算法在保证时间效率的前提下预测准确性明显优于已有预测算法.2)针对复杂多模式运动行为,利用高斯混合回归方法建模,计算不同运动模式的概率分布,将轨迹数据划分为不同分量,利用高斯过程回归预测移动对象最可能运动轨迹.实验证明,相比于基于隐马尔科夫模型和卡尔曼滤波的预测方法,所提方法具有较高的预测准确性和较低的时间代价.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号