首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
空间并置(co-location)模式是指在空间邻域内空间特征的实例频繁地出现在一起所形成的非空特征子集.人们已经对确定数据和不确定数据的top-k空间co-location模式挖掘进行了相关研究,但是针对模糊特征的top-k平均效用co-location模式挖掘的研究还没有.提出模糊特征的top-k平均效用co-lo...  相似文献   

2.
空间co-location模式是一组空间特征的子集,它们的实例在邻域内频繁并置出现。通常,空间co-location模式挖掘方法假设空间实例相互独立,并采用空间实例参与到模式实例的频繁性(参与率)来度量空间特征在模式中的重要性,采用空间特征的最小参与率(参与度)来度量模式的有趣程度,忽略了空间特征间的某些重要关系。因此为了揭示空间特征间的主导关系而提出主导特征co-location模式。现有主导特征模式挖掘方法是基于传统频繁模式及其团实例模型进行挖掘,然而,团实例模型可能会忽略非团的空间特征间的主导关系。因此,基于星型实例模型,研究空间亚频繁co-location模式的主导特征挖掘,以更好地揭示空间特征间的主导关系,挖掘更有价值的主导特征模式。首先,定义了两个度量特征主导性的指标;其次,设计了有效的主导特征co-location模式挖掘算法;最后,在合成数据集和真实数据集上通过大量实验验证了所提算法的有效性以及主导特征模式的实用性。  相似文献   

3.
空间并置(co-location)模式是指其实例在空间邻域内频繁共现的空间特征集的子集。现有的空间co-location模式挖掘的有趣性度量指标,没有充分地考虑特征之间以及同一特征的不同实例之间的差异;另外,传统的基于数据驱动的空间co-location模式挖掘方法的结果常常包含大量无用或是用户不感兴趣的知识。针对上述问题,提出一种更为一般的研究对象--带效用值的空间实例,并定义了新的效用参与度(UPI)作为高效用co-location模式的有趣性度量指标;将领域知识形式化为三种语义规则并应用于挖掘过程中,提出一种领域驱动的多次迭代挖掘框架;最后通过大量实验对比分析不同有趣性度量指标下的挖掘结果在效用占比和频繁性两方面的差异,以及引入基于领域知识的语义规则前后挖掘结果的变化情况。实验结果表明所提出的UPI度量是一种兼顾频繁和效用的更为合理的度量指标;同时,领域驱动的挖掘方法能有效地挖掘到用户真正感兴趣的模式。  相似文献   

4.
空间极大co-location模式挖掘研究   总被引:1,自引:0,他引:1  
空间co-location模式代表了一组空间特征的子集,它们的实例在空间中频繁地关联。挖掘空间co-location模式的研究已经有很多,但是针对极大co-location模式挖掘的研究非常少。提出了一种新颖的空间极大co-location模式挖掘算法。首先扫描数据集得到二阶频繁模式,然后将二阶频繁模式转换为图,再通过极大团算法求解得到空间特征极大团,最后使用二阶频繁模式的表实例验证极大团得到空间极大co-location频繁模式。实验表明,该算法能够很好地挖掘空间极大co-location频繁模式。  相似文献   

5.
空间co-location(并置)模式是一组空间特征的子集,其实例在空间中频繁地邻近出现.由于空间数据同时存在关联性和异质性,co-location模式实例的分布或在整个研究区域中全局出现(全局co-location模式),或在研究区域的局部区域出现(区域co-location模式),从而提出了多级co-location模式挖掘.当前的多级co-location模式挖掘方法存在两个问题:1)已有的多级co-location模式挖掘方法忽略了模式在空间中的分布特性,未能准确区分全局和区域co-location模式;2)已有的多级模式挖掘方法将全局非频繁co-location模式作为候选区域co-location模式,导致候选区域co-location模式数量过多.针对以上问题,首先,定义了模式的实例分布均匀系数,在考虑模式频繁性的同时考虑了模式在空间中的分布情况,从而正确、高效地识别出全局和区域co-location模式.其次,基于模式的实例分布均匀系数,设计了一个有效的多级co-location模式挖掘算法,提出了有效的剪枝策略以提高算法效率.最后,在真实和合成数据集上进行了广泛的实验,验证了所提方法的正确性和高效性.  相似文献   

6.
空间并置(co-location)模式是指其特征的实例在地理空间中频繁并置出现的一组空间特征的集合。传统co-location模式挖掘通常由用户给定一个邻近阈值来确定实例的邻近关系,使用单一的邻近阈值来判定两个空间实例的邻近性可能会造成邻近关系的缺失,也没有考虑距离大小的不同对邻近关系的影响。同时,传统方法主要利用频繁性阈值来衡量模式的频繁性,存在着算法效率对频繁性阈值较为敏感的问题。由于频繁并置的特征间具有较高的邻近度,因此利用聚类算法可以将其聚集在一起,加之邻近以及特征间的并置都是模糊的概念,因此将模糊集理论与聚类算法相结合,研究了空间co-location模式挖掘中的模糊挖掘技术,在定义模糊邻近关系的基础上,定义了度量特征之间邻近度的函数,基于特征邻近度利用模糊聚类算法挖掘co-location模式,最后通过广泛的实验验证了提出方法的实用性、高效性及鲁棒性。  相似文献   

7.
空间co-location(并置)模式是指实例在空间中频繁关联的一组空间特征的子集.在空间数据挖掘中,现有算法主要针对的是正模式的挖掘,而空间中还存在着具有强负相关性的模式,如负co-location模式,这类模式的挖掘在一些应用中同样具有重要的意义.现有的负co-location模式挖掘算法的时间复杂度较高,挖掘到的...  相似文献   

8.
空间数据挖掘旨在从空间数据库中发现和提取有价值的潜在知识.空间co-location(共存)模式挖掘一直以来都是空间数据挖掘领域的重要研究方向之一,其目的 是发现一组频繁邻近出现的空间特征子集,而空间高效用co-location模式挖掘则考虑了特征的效用属性.二者在度量空间实例的邻近关系时一般都需要预先给定一个距离阈值...  相似文献   

9.
飞速发展的物联网技术不断催生海量带有时间和空间属性的数据集.这些数据集掀起了以空间co-location模式挖掘为代表的空间数据挖掘研究的高潮.传统空间co-location模式挖掘研究主要发现空间中频繁并置出现的特征的子集.特征在模式内部是无序的,特征之间的地位是平等的.例如,co-location模式{看守所,刑警中队,武警中队}表示看守所附近往往存在刑警中队和武警中队,反之亦然.然而,由于空间分布密度差异显著存在,现实中存在特征地位不平等的模式,这些模式中的某些特征(核特征)附近频繁地出现其它特征(非核特征)的实例,而这些非核特征附近不一定频繁地出现核特征的实例.例如,某些肿瘤疾病与某些污染源的关系.在传统模型中,用户为了发现感兴趣的模式不得不将频繁性阈值设置得很低,以至于忽略了模式中特征的主从关系.本文聚焦于前述现象,研究在空间数据集中挖掘核特征与非核特征组成的有趣模式.首先,基于核邻居定义空间co-location核频繁模式(简称核模式)的概念.核邻居与最近邻息息相关,它不仅遵从地理学第一定律而且能排除无关实例的干扰.其次,提出核模式的有趣性度量理论,分析核模式具有的性质,如...  相似文献   

10.
空间并置(co-location)模式挖掘是指在大量的空间数据中发现一组空间特征的子集,这些特征的实例在地理空间中频繁并置出现.传统的空间并置模式挖掘算法通常采用逐阶递增的挖掘框架,从低阶模式开始生成候选模式并计算其参与度(空间并置模式的频繁性度量指标).虽然这种挖掘框架可以得到正确和完整的结果,但是带来的时间和空间开...  相似文献   

11.
This paper examines a d-dimensional extension of the Cox-Lewis statistic and investigates its power as a function of dimensionality in discriminating among random, aggregated and regular arrangements of points in d-dimensions. It was motivated by the Clustering Tendency problem which attempts to prevent the inappropriate application of clustering algorithms and other exploratory procedures. After reviewing the literature, the d-dimensional Cox-Lewis statistic is defined and its distribution under a randomness hypothesis of a Poisson spatial point process is given. Analytical expressions for the densities of the Cox-Lewis statistic under lattice regularity and under extreme clustering are also provided. The powers of Neyman-Pearson tests of hypotheses based on the Cox-Lewis statistic are derived and compared. Power is a unimodal function of dimensionality in the test of lattice regularity, with the minimum occurring at 12 dimensions.The power of the Cox-Lewis statistic is also examined under hard-core regularity and under Neyman-Scott clustering with Monte Carlo simulations. The Cox-Lewis statistic leads to one-sided tests for regularity having reasonable power and provides a sharper discrimination between random and clustered data than other statistics. The choice of sampling window is a critical factor. The Cox-Lewis statistic shows great promise for assessing the gross structure of data.  相似文献   

12.
居住空间行为模拟与城市空间增长   总被引:2,自引:0,他引:2       下载免费PDF全文
模拟城市要素空间增长对城市系统的合理调控有着十分重要的意义,而居住的空间增长是城市空间增长的主要部分。本文将在分析城市要素空间相互作用的基础上,建立居住空间选择行为模型。并在地理信息系统和空间分析支持下,建立城市居住的空间增长动态模拟系统。  相似文献   

13.
房屋空置率是衡量房地产市场健康与否的重要指标。基于夜间灯光遥感数据和全国土地覆盖数据,对房屋空置率进行空间识别。利用微博签到数据,通过基于密度的聚类算法和热力分析对居民活动空间强度进行分析,从“鬼城”指数排名靠前的100个城市中随机选择30个样本城市,进行城市内部房屋空置空间识别。结果表明:2013年全国地级及以上城市基于像元的平均房屋空置率为27.3%。东部地区房屋空置率较低,中西部地区房屋空置现象明显;房屋空置在中小型城市更加突出。  相似文献   

14.
Housing Vacancy Rate (HVR) is an important index in assessing the healthiness of residential real estate market. Due to lack of clear and effectively evaluation criterion, the understanding of housing vacancy in China is then rather limited. This paper quantitatively analyzed spatial identification and difference pattern of house vacancy at different scale in China by using nighttime light data and micro-blog check-in data, in order to make up the deficiency of traditional methods in the aspects of data missing and differential approach. The nighttime light intensity for non-vacancy area is estimated after removing the nighttime light intensity from non-residential sources of NPP-VIIRS light data and difference of nighttime light caused by the different urban area ratio. Then, the HVR is calculated for the spatial pattern analysis. This paper analyzed the spatial strength of residents activities by using micro-blog check-in data, based on density-based spatial clustering of applications with noise and heat map. The 30 sample cities were selected to identify house vacancy from 100 cities which ghost city index were high. The following conclusions were drawn through the study: The HVR of eastern coastal cities and regions with rapid development of economy were lower, while the phenomenon of house vacancy in central and western regions were more obvious. The HVR increased from eastern coastal regions to inland areas. What’s more, the phenomenon of house vacancy in middle and small cities were more distinct from the aspect of urban scale. The house vacancy of China were divided into five types: industry or resources driven, government planned, epitaxy expansionary, environmental constraint and speculative activate by taking the factors of natural environment, social economic development level, and population density into consideration. This may shed light on policy implications for Chinese urban development.  相似文献   

15.
通过对1986~2000年两期TM影像数据的处理,得到14年间甘肃省土地沙漠化的最新动态数据。引用沙漠化规模、沙漠化程度指数对甘肃省土地沙漠化空间格局进行了分析,结果表明:无论是沙漠化发生的规模,还是沙漠化发生的程度,甘肃省沙漠化均呈现出以兰州为界的东西部地域分异。表现为:在沙漠化发生规模上,河西走廊地区超过了东部;而在沙漠化发生程度上,则东部超过了河西地区。从发生角度研究,固定、半固定沙地活化是甘肃省沙漠化的主要发生源。  相似文献   

16.
基于空间模式聚类最大熵图像分割算法研究   总被引:3,自引:0,他引:3  
陈秋红  沈云琴 《计算机仿真》2012,29(1):214-216,326
研究图像分割优化问题,在分割图像中,提取信息受到各种因素影响,分割效果不理想。针对图像分割计算复杂,造成图像分割分辨率低,清晰度不高。同时,当图像中的信息量非常大时,图像分割非常耗时。为了有效地分割图像,提出了一种基于空间模式聚类和最大熵算法原理相结合的图像分割方法。首先对图像采用最大熵算法进行图像分割,为每个熵区域定义特征量。根据不同的特征量计算相似区域之间的欧氏距离和空间距离,从而确定像素聚类中心的距离。然后对分割后的图像区域采用基于空间模式聚类方案进行合并,并对图像进行二值化处理。仿真表明与传统图像分割相比,提高了分割效率,分割出的图像边缘效果清晰,证明了算法的可行性和有效性。  相似文献   

17.
植被物候的检测对于认识自然季节现象的变化规律,服务农作物生产、全球变化、生态学应用方面具有重要价值。植被指数是描述植被数量、质量、植被长势和生物量指标的重要参数。利用SPOT VEGETATION NDVI时间序列数据,采用Savitzky-Golay滤波方法重建了NDVI的年内变化序列,并利用此数据提取了黑河流域植被物候空间分布格局。结果表明,采用此方法得到的植被物候信息和该区域的农事历信息符合较好。黑河流域植被物候具有明显的空间格局。上游的高寒草地区生长季长度较短。中游地区受人类活动影响严重,较为符合该区农作物生长信息。  相似文献   

18.
彭红 《计算机仿真》2012,29(2):257-259,395
研究图像配准精确度问题。由于两张图片几何关系及量度均有不同,要达到配准效果应有空间一致性。传统的聚类图像配准算法进行图像配准时,配准精度较低,算法复杂度高等不足。为了有效提高图像配准的精确度,提出了一种改进的数学形态学和聚类算法相结合的图像配准方法。算法首先改进的基于空间模式均值聚类对图像进行区域分块,并对分块的位置进行空间聚类,并准确计算出基准图像的最后的配准位置,并采用数学形态学方法对配准后的图像进行边缘处理,最后评估配准图像的质量。仿真结果表明,提出的改进的算法有效的提高了配准精确度,是一种可行性有效的图像配准算法,为图像配准提供了依据。  相似文献   

19.
曾新  杨健 《计算机科学》2016,43(2):293-296, 301
空间数据挖掘的相关研究大多数是基于理想化数据和实例平等的思想,而忽略了实际场景中存在的时间约束条件。将实例存在的时间区间作为约束条件,重新定义了空间邻近关系R,提出了带有时间约束的频繁模式挖掘算法TI,并以时间重叠作为剪枝条件,提出了剪枝算法TI-C。通过实证数据分析得出:在相同数据集下,TI-C算法的效率要优于TI,采用TI-C算法 得到的频繁模式个数要比join-based算法少,同时采用TI-C算法得到的频繁模式能更精确、真实地反映实际场景中对象的并置关系。  相似文献   

20.
基于特征统计可分性的遥感数据专题分类尺度效应分析   总被引:8,自引:0,他引:8  
现有的对地观测遥感卫星能够提供从0.61 m到数十公里空间分辨率的遥感数据。通过遥感数据的专题分类得到的专题图的精度不但受遥感数据光谱特征、遥感数据处理和分类过程的影响, 而且受到所用的遥感数据的空间分辨率的影响。遥感数据空间分辨率的变化对遥感专题分类精度的影响受混合像元数目的变化和类内光谱特征变异程度的变化这两个矛盾的因子影响。空间分辨率对分类精度的最终影响决定于这两个矛盾影响因子的净效应。通过分析遥感专题分类中分类特种的统计可分性随遥感数据空间分辨率的变化来分析空间分辨率变化对分类精度的净效应。采用变换的离散度作为特征的统计可分性度量。以TM数据进行土地利用/土地覆被分类为例,首先将原始分辨率的图像以简单平均方法逐步尺度扩展到不同分辨率,然后在原始空间分辨率的图像上,根据该地区土地利用图进行层次随机采样,并以原始分辨率图像上的随机采样位置为掩模,在尺度扩展后的图像上进行同样位置的随机采样,最后在各空间分辨率上分别计算类对间的变换离散度。对变换的离散度随空间分辨率变化的规律进行了分析和定性解释。研究表明,类对间空间邻接结构对类别间混合像元数目随空间分辨率的变化有决定性影响;不同类对之间的最大统计可分性可能发生在不同的空间分辨率;空间分辨率越高,并不一定分类精度越高;不同类别之间的分类需要不同空间分辨率的数据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号