共查询到18条相似文献,搜索用时 78 毫秒
1.
李子沁 《电脑编程技巧与维护》2018,(2):120-121,136
利用现有的轨迹数据进行城市规划已逐渐成为一个值得研究的课题.针对电信公司提供的数据,提出了将轨迹分段聚类的算法.该算法首先将轨迹划分为一系列轨迹段,然后将相似的轨迹段聚到一个类中.在分段这部分使用最小描述长度(MDL)原则,在聚类阶段采用高斯混合模型(GMM).证明了该算法利用上海电信数据可以很好地聚类,直观地展示出行人的活动方式对城市规划起到重要意义. 相似文献
2.
序列分段问题是指将序列进行分段,用这些分段来代表一个序列,使原始序列在视觉角度基本不发生变化。本文首先介绍了三类经典的分段算法,比较它们的优劣,并针对其特点提出了一种改进的基于聚类的滑动窗口分段算法,并将其与经典算法作了一些比较,从而验证了新算法比经典算法有更好的拟合度和收敛性。 相似文献
3.
分析用户行为对网络用户的管理控制有着重要意义。用户行为实质上是一系列的数据交换过程, 最终会体现为业务流, 且这些业务流在时间上表现出一定的规律性。通过研究业务流的时序关系来分析用户行为的规律, 提出一种用户行为的分析方法。该方法分为三个阶段, 分别基于分形模型、改进的最大距离聚类法和Apriori算法进行分段、聚类和时序分析, 最终从用户的数据交换中获知用户的行为规律。实验表明, 该方法在无法获知用户消息的具体内容的前提下, 仍能较为准确地区分各类报文序列, 并能有效发现用户信息发送行为的规律。 相似文献
4.
目前常见的轨迹聚类大多基于OPTICS、DBSCAN和K-means等算法,但这些聚类方法的时间复杂度随着轨迹数量的增加会大幅上升。针对该问题,提出一种基于密度核心的轨迹聚类算法。通过引入密度核心的概念,设计轨迹密度计算函数以获取聚类簇的致密核心轨迹,同时利用出租车载客轨迹自身的方向和速度等属性提取轨迹特征点,减少轨迹数据量。在此基础上,根据聚类簇中致密核心轨迹与参与聚类轨迹的相似度距离判断轨迹的匹配程度,进而聚合相似轨迹,并将聚类结果储存在聚类节点中。实验结果表明,与TRACLUS和OPTICS聚类算法相比,该算法能够得到更准确的聚类效果,并且时间效率更高。 相似文献
5.
传统的空间聚类算法解决的是未带障碍约束的空间数据聚类问题,而现实的地理空间中经常会存在河流、山脉等阻碍物,因此,传统空间聚类算法不适用于带障碍数据约束的现实空间.在解析了带障碍空间聚类相关概念和定义的前提下,对带障碍约束条件的空间聚类算法进行梳理,给出了这类算法的研究历史和沿袭关系,并把这类算法按七个维度分为四大类,分析了每类的技术优缺点,最后给出了带障碍约束的空间聚类算法的未来研究趋向. 相似文献
6.
7.
本文提出了一种新的聚类分段算法,这个算法以段内平均离散度最小、段间平均离散度最大为准则,采用聚类的方法逐次迭代选择最佳分段断点和分段段数,能正确地对汉语语音进行音素分段,它和以往分段方法相比在性能上有很大提高.文中还给出了应用该算法对汉语单音所作的部分实验统计结果,可供进一步开展基于音素或音位的汉语语音识别研究参考. 相似文献
8.
K-means算法是数据挖掘领域研究、应用都非常广泛的一种聚类算法,其各种衍生算法很多,其中包括近年出现的以点对称距离为测度的K-means聚类算法。在点对称距离聚类算法的基础上提出一种新的聚类算法,根据对对称性的分析,为对称性的描述增加方向约束,提高对称距离的描述准确性,以此来提高聚类的准确性。同时,针对对称点成对出现的特点,调整了聚类过程中的收敛策略,以对称点对连线中点计算聚类中心,改善了基于对称距离的聚类算法收敛性能。通过数值仿真比较了所提算法与原有算法的优劣,结果显示该算法在计算复杂度不变的条件下获得了更准确的结果,聚类结果更接近数据的真实分类。 相似文献
9.
随着卫星定位传感器的普及应用,形成了海量移动对象的轨迹数据.轨迹数据含有丰富的时空特征信息,通过对相关数据聚类处理,可以挖掘出移动对象的活动场景、位置等属性信息.通过借鉴神经成像学领域中的QuickBundles算法,介绍算法原理和实现,并基于此算法实现了一种轨迹聚类方法,通过使用实际GPS数据对此方法进行验证,从对聚... 相似文献
10.
移动对象轨迹聚类在城市规划、公共空间设计、移动对象行为预测等领域具有重要的理论指导意义和实际应用价值。针对传统聚类算法(如k-means,DBSCAN)在移动对象轨迹方面聚类效果不佳的问题,提出一种新的轨迹聚类算法iBTC。该算法首先对轨迹进行分段,根据最小描述长度原理,将轨迹分段问题转换为求无向图的最短路径问题,使用Dijkstra算法求得轨迹的最佳分段;然后将轨迹聚类问题转换为一种特殊的异常检测问题,并基于独立森林的思想,使用细分-合并过程对轨迹数据进行聚类;最后在模拟数据集和监控视频记录的行人轨迹公开数据集上进行实验,结果表明该算法能够取得较好的聚类效果。 相似文献
11.
基于密度的聚类算法(DBSCAN)是最有效的轨迹数据挖掘方法之一,但基于密度的聚类算法往往受到输入参数选择的限制。在轨迹数据挖掘中,聚类结果不仅受到类内距离和类间距离的影响,还受到聚类中坐标点个数的影响。因此,提出了一种新的基于内外占空比的集群有效性指标来平衡这三个因素,该指标可以自动选择密度聚类的输入参数,并在不同的数据集上形成有效的聚类,优化后的聚类方法可应用于出行者行为轨迹的深度分析和挖掘。实验结果证明,与传统的有效性指标相比,提出的基于占空比的评价指标能够优化输入参数,获得较好的出行者位置信息聚类结果。 相似文献
12.
本文研究加速K-medoids聚类算法,首先以PAM(Partitioning Around Medoids)、TPAM(Triangular Inequality Elimination Criteria PAM)算法为基础,给出两个加速引理,并基于中心点之间距离不等式提出两个新加速定理.同时,以O(n+K2)额外内存空间开销辅助引理、定理的结合而提出加速SPAM(Speed Up PAM)聚类算法,使得K-medoids聚类算法复杂度由O(K(n-K)2)降低至O((n-K)2).在实际及人工模拟数据集上的实验结果表明,相对PAM、TPAM、FKMEDOIDS(Fast K-medoids)等参考算法均有改进,运行时间比PAM至少提升0.828倍. 相似文献
13.
基于流形距离的人工免疫半监督聚类算法 总被引:1,自引:1,他引:0
将流形距离作为样本间相似性的基本度量测度,加入成对约束信息,通过近部传播得出新的度量矩阵。把聚
类问题转化为一优化数学模型。采用克隆选择算法求解这个优化模型,得出最后的聚类结果,通过人工数据集和UCI
标准数据集验证了这种方法具有较高的准确性。 相似文献
14.
在现有多种距离度量和传统谱聚类算法的基础上,提出了一种新的基于有效距离的谱聚类算法(spectral clustering based on effective distance,SCED)。SCED算法通过稀疏重构系数来构建样本与样本之间的有效距离,从而代替传统谱聚类算法中的欧氏距离,进行样本之间的相似度评估。与传统距离度量相比,有效距离不仅利用了样本对之间的距离信息,同时考虑了目标样本与其他所有相关样本之间的距离信息,因而该距离度量具有全局特性。在UCI标准数据集上的实验结果表明,SCED算法能有效提高聚类效果。 相似文献
15.
16.
针对当前XML文档结构聚类算法的一些不足,指出XML文档树中节点的重复和嵌套影响聚类的质量和效率.利用重复剪枝和嵌套剪枝简化XML文档树的表示,然后根据化简后的结构计算两棵XML文档树中的编辑距离,在此基础上得出两棵树整体的结构相似度量,按照层次聚类方法得到聚类结果.实验证明该算法有比较高的查全率和查准率,有效降低了时间复杂性,具有改进效果. 相似文献
17.