首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
论文中分析了城市出租车的轨迹和检测社会集群.为了更好地检测轨迹中可能的群落,提出了一种鲁棒的社区检测算法.该算法从轨迹集中提取数据特征空间关系矩阵,并使用这个矩阵定义轨迹相似度矩阵.将相似度矩阵变换为相异度矩阵,基于相异度的稀疏子集选择(DS3)算法用于分析多个稀疏子集.每个子集对应于一个集群,该集群是要检测的社区.这...  相似文献   

2.
基于层次聚类的孤立点检测方法   总被引:2,自引:1,他引:2       下载免费PDF全文
孤立点检测是数据挖掘过程的重要环节,提出了基于层次聚类的孤立点检测(ODHC)方法。ODHC方法基于层次聚类结果进行分析,对距离矩阵按簇间距离从大到小检测孤立点,可检测出指定离群程度的孤立点,直到达到用户对数据的集中性要求。该方法适用于多维数据集,且算法原理直观,用户友好,对孤立点的检测准确率较高。在iris、balloon等数据集上的仿真实验结果表明,ODHC方法能有效地识别孤立点,是一种简单实用的孤立点检测方法。  相似文献   

3.
针对采样不规则轨迹的停留点检测准确性不高的问题,提出了一种基于时间序列聚类的停留点检测算法。首先基于数据场理论设计了一种综合考虑时空特性的混合特征密度测量方法,然后根据停留点中心密度比入口大的特性,采用过滤—精炼策略提取停留点。在过滤阶段,将时间连续且满足最小密度阈值的点作为候选停留点。在精炼阶段,通过最大阈值筛选出实际停留点。实验结果表明,该方法能够有效检测采样不规则轨迹中的停留点,相较于已有方法具有较高的准确性和较低的时间消耗。  相似文献   

4.
随着经济的发展,城市交通拥堵问题亟待解决,交通量过载发现是解决交通拥堵问题的有效方法之一。提出一种基于HMM模型的轨迹聚类算法HMM-Cluster,可有效地发现交通量过载情况。该算法首先提取时空轨迹特征点,并采用维数约简技术减少轨迹数据量,根据参照轨迹拟合HMM模型,基于密度函数得到轨迹相似度矩阵,最后给出聚合的相似性轨迹。真实轨迹数据集上的对比实验结果表明,提出的HMM-Cluster可有效地挖掘移动对象运动模式,准确发现交通量过载情况,具有一定实用价值。  相似文献   

5.
基于聚类的出租车异常轨迹检测   总被引:1,自引:0,他引:1  
《计算机工程》2017,(2):16-20
出租车全球定位系统数据中蕴含城市交通和移动对象行为的宏观信息,从中可以挖掘出有价值的异常轨迹模式。将位置和几何形状、行驶时间分别作为出租车轨迹的空间与时间特征,根据特征偏离情况划分时间、空间和时空异常轨迹。从轨迹数据中提取相同起终点的轨迹集,将轨迹划分成轨迹片段,计算轨迹间的相似度并进行基于距离和密度的聚类,在空间特征上初步分离出频繁和稀疏轨迹,根据数据异常判定的kσ准则确定时间特征异常的分离阈值,对时间特征进行再次划分,最终实现出租车异常轨迹检测。实验结果表明,该方法能从异常轨迹中挖掘出个性化路线、异常停留位置和交通路段,为智能交通、物流高效规划和执行等提供参考信息。  相似文献   

6.
随着卫星定位传感器的普及应用,形成了海量移动对象的轨迹数据.轨迹数据含有丰富的时空特征信息,通过对相关数据聚类处理,可以挖掘出移动对象的活动场景、位置等属性信息.通过借鉴神经成像学领域中的QuickBundles算法,介绍算法原理和实现,并基于此算法实现了一种轨迹聚类方法,通过使用实际GPS数据对此方法进行验证,从对聚...  相似文献   

7.
随着基于位置的社交网络的发展,时空-文本等轨迹数据量呈指数式增长,与此同时数据低质的问题日益显著。高质的签到数据可以使研究人员更好地从中挖掘丰富且有意义的知识,因此为了更有效地使用签到大数据,数据预处理必不可少。签到数据具有冗余度高、同时签到、时空签到跨度大等低质问题,导致不能直接使用现有的数据预处理流程和方法。针对签到数据特性,提出一套具有针对性的数据预处理流程。通过平均化处理消除了签到轨迹中存在的同时签到数据;通过学习基于熵的时间戳间隔阈值划分签到轨迹,解决签到轨迹时间跨度大的问题;利用基于密度聚类的方法实现签到轨迹分层,解决空间跨度大的问题。实验采用真实的签到轨迹数据,从离群点和分层效果两个方法对预处理效果进行评价,实现不同空间粒度的签到轨迹分离预处理,为后续的轨迹分析与挖掘奠定基础。  相似文献   

8.
基于自适应聚类的数据预处理算法Ⅰ   总被引:4,自引:1,他引:4  
提出了KDD的一种逻辑模型。以数据库或数据仓库中的数据为例,根据先验知识或可能的挖掘目标,利用SQL命令滤除无关属性,形成基于某种概念分层的归纳数据库或汇总数据库。针对数据库中的属性,利用非监督学习算法,获取相应聚类,从而形成面向任务的目标数据子集,以保证数据挖掘结果的质量和有效性。  相似文献   

9.
利用现有的轨迹数据进行城市规划已逐渐成为一个值得研究的课题.针对电信公司提供的数据,提出了将轨迹分段聚类的算法.该算法首先将轨迹划分为一系列轨迹段,然后将相似的轨迹段聚到一个类中.在分段这部分使用最小描述长度(MDL)原则,在聚类阶段采用高斯混合模型(GMM).证明了该算法利用上海电信数据可以很好地聚类,直观地展示出行人的活动方式对城市规划起到重要意义.  相似文献   

10.
为解决轨迹聚类问题,提出一种新的无监督轨迹聚类及聚类有效性评估方法。通过建立双层字符串轨迹模型,计算得到轨迹间距离并用作聚类依据。提出轨迹同距点比例的概念,以此作为聚类工具,并采用类内平均同距点比例作为聚类有效性评价值。利用麻省理工大学(Massachusetts Institute of Technology,MIT)停车场行人路径数据集进行实验,实验结果表明,新的无监督聚类算法能较好地完成轨迹聚类任务,平均类内同距点比例能够很好地衡量分类效果。  相似文献   

11.
针对自驾车游客加油轨迹稀疏,还原真实旅游路线困难的问题,提出一种基于语义表示的稀疏轨迹聚类算法,用以挖掘流行的自驾车旅游路线。与基于轨迹点匹配的传统轨迹聚类算法不同,该算法考虑不同轨迹点之间的语义关系,学习轨迹的低维向量表示。首先,利用神经网络语言模型学习加油站点的分布式向量表示;然后,取每条轨迹中所有站点向量的平均值作为该轨迹的向量表示;最后,采用经典的k均值算法对轨迹向量进行聚类。最终的可视化结果表明,所提算法有效地挖掘出了两条流行的自驾车旅游线路。  相似文献   

12.
轨迹模式是航空器在某段时间或某个区域内相对稳定的飞行模式,对理解和判断目标在一段时间或一定区域内的行为有着重要的意义。针对目标轨迹的特点,在基于点密度的聚类算法的基础上,设计并实现了一种基于线段密度的轨迹聚类方法。该方法使用最小描述长度原则将目标的历史轨迹分割为若干轨迹段,通过计算轨迹段之间的相似度对飞行轨迹进行聚类,最后运用扫描线算法生成目标的轨迹模式。实验证明,该方法可以较为准确地从大量轨迹数据中发掘出航空器目标的轨迹模式。  相似文献   

13.
提出了一种新的基于PCA和K-均值聚类的有监督二叉分裂层次聚类方法PCASHC,用K-均值聚类进行逐次二叉聚簇分裂,选择PCA第一主成分相距最远样本点作为K-均值聚类初始聚簇中心,解决了K-均值聚类初始中心随机选择导致结果不确定的问题,用聚簇样本类别方差作为聚簇样本不纯度控制聚簇分裂水平,避免过拟合,可学习到合适的聚类数目。用四组UCI标准数据集对其进行了10折交叉验证分类误差检验,与另外七种分类器相比说明PCASHC有较高的分类精度。  相似文献   

14.
如何实现数据的安全共享,促进多源数据的碰撞、融合是当前学术界和产业界共同面临的重要技术挑战之一,近年来,联邦学习作为应对这一挑战的新技术受到了广泛的关注,已在智慧医疗、智慧城市建设等领域得到应用,但是在充满潜力的轨迹数据挖掘领域却鲜有研究。为了解决这个问题,提出一种安全的、分布式的基于联邦学习的谱聚类算法框架FSC(federated spectral clustering),并应用于船舶AIS(automatic identification system)轨迹数据谱聚类。该算法通过加密样本对齐技术和同态加密技术,在保证用户数据安全的前提下实现了多参与方联合训练机器学习模型。实验部分以合成数据和船舶AIS轨迹数据为样本,通过与其他聚类算法对比,验证算法具有良好的聚类性能;聚类结果能够准确提取水域船舶的主要航线,可为海事监管系统智能化提供技术支撑。  相似文献   

15.
一种基于模糊聚类的资源发现策略   总被引:3,自引:0,他引:3  
Chord是一款较为成功的P2P资源发现算法,但在网格环境中由于网格资源固有的特性,影响了其发现效率。针对网格资源的复杂多样性以及很难精确分析其相似程度,提出利用模糊聚类的方法对资源进行属性划分,将资源分成多个资源相似集合,结合Chord路由算法,相似资源存放在较近的Peer上组织成2维Chord结构。实验结果表明,与原Chord路由算法相比,该策略能有效降低查寻时间,资源发现效率明显提高。  相似文献   

16.
针对基于密度的聚类方法不能发现密度分布不均的数据样本的缺陷,提出了一种基于代表点和点密度的聚类算法。算法通过检查数据库中每个点的k近邻来寻找聚类。首先选取一个种子点作为类的第一个代表点,其k近邻为其代表区域,如果代表区域中的点密度满足密度阈值,则将该点作为一个新的代表点,如此反复地寻找代表点,这些区域相连的代表点及其代表区域将构成一个聚类。实验结果表明,该算法能够发现任意形状、大小和密度的聚类。  相似文献   

17.
基于边聚集系数的社区结构发现算法*   总被引:1,自引:1,他引:0  
将超图模型以及基于此的聚类算法应用到社区结构发现的领域。对于简单图的社区结构发现,引入边聚集系数的概念,提出了基于边聚集系数的社区发现算法。将安然邮件数据集作为测试数据集,通过算法对比分析,证明该算法在时间复杂度上可以提高一个数量级。  相似文献   

18.
19.
阐述了一种主题发现系统,它能发现数据流中的隐含知识,并将其表述为含有主题/副主题的层次树,每个主题包含与其相关的文档集和文档摘要,以便于用户从层次树中浏览和选择所需主题.并提出了一种增量层次聚类算法,该算法结合了划分聚类和凝聚聚类的主要优点.实验结果表明,无论是作为主题检测系统还是分类和概括工具,该算法都是高效的.  相似文献   

20.
公共安全异常检测的需求越来越迫切,监控中基于轨迹聚类的检测方法越来越流行,但是现有方法在处理高维不等长轨迹数据时效果并不理想。提出一个新的轨迹聚类方法,该方法通过组合动态时间弯曲和密度峰算法实现。动态时间弯曲用于度量轨迹间的距离,密度峰算法根据距离进行聚类。前者可直接度量不等长轨迹聚类,后者是近年提出的非球体分布数据聚类算法,以局部密度和最近邻聚类组合实现。实验在PETS2006监控视频数据集上进行,测试结果表明该方法有效地发现了异常的轨迹行为模式。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号