排序方式: 共有33条查询结果,搜索用时 15 毫秒
1.
近年来,异常检测技术在分析和利用船舶轨迹数据中扮演着越来越重要的角色,已经成为航海领域的一个热点研究方向。船舶轨迹的异常检测旨在利用相关的异常检测算法,研究船舶个体或群体的行为特征,发现隐藏在其中的船舶异常行为模式或船位。主要从船舶位置和行为方面分析了船舶异常行为的概念和分类,综述了船舶轨迹异常检测的方法,评述了各方法在船舶轨迹异常检测中应用的优点和不足,讨论了船舶轨迹异常检测存在的问题和面临的挑战。 相似文献
2.
密度峰值快速搜索与聚类算法及其在船舶位置数据分析中的应用 总被引:1,自引:0,他引:1
密度峰值快速搜索与聚类算法(CFSFDP)是2014年发表在《科学》上的一种新颖的聚类算法,该算法通过计算样本点的局部密度和到局部密度比它大的样本点的距离,采用决策图的形式确定聚类中心,能快速发现任意形状数据集的密度峰值点,并高效进行非中心样本点分配。但是当数据集中簇间密度差别较大或者某个簇中存在多密度峰值时,聚类结果较差。针对该问题,采用相对密度作为度量样本点密度的尺度搜索密度峰值,优化CFSFDP算法。人造数据集和UCI真实数据集上的实验表明,在没有显著提高时间复杂度的基础上,算法的性能优于CFSFDP算法和具有噪声的基于密度的聚类应用(DBSCAN)算法。最后将新算法应用于船舶位置数据,分析船舶交通流特征和群体行为模式,取得了满意的结果。 相似文献
3.
4.
传统的用于Web日志聚类的算法大都需要用户指定聚类个数。提出了一种新的自适应聚类算法并对Web日志用户会话进行聚类。该算法基于凝聚聚类思想和划分聚类思想,用初始数据集中每2个会话之间的相异度作为距离的度量,合并距离小于一定阈值的两个会话以产生初始聚类,再根据一定的规则动态地合并距离最小的会话类或会话,算法的结果是产生自然的聚类。最后,通过比较会话聚类的内部距离和类间距离来验证算法的有效性。这种聚类算法的最大优点在于,他能够产生自动的聚类,而不需要用户事先指定需要产生的聚类个数,并且能有效识别孤立点。实验表明,这种聚类能够产生较高质量的聚类效果。 相似文献
5.
在数据挖掘中,分期是一个很重要的问题,有很多流行的分类器可以创建决策树木产生类模型。本文介绍了通过信息增益或熵的比较来构造一棵决策树的数桩挖掘算法思想,给出了用粗糙集理论构造决策树的一种方法,并用曲面造型方面的实例说明了决策树的生成过程。通过与ID3方法的比较,该种方法可以降低决策树的复杂性,优化决策树的结构,能挖掘较好的规则信息。 相似文献
6.
针对利用最小包围盒(MBB)压缩的移动物体时空轨迹,为了能对其进行有效地聚类,提出了一个基于盒内数据点密度的轨迹间相似性度量公式.首先,把两条轨迹的相似性度量转化为两条轨迹上有时间交叠的MBB之间的相似性度量,这在很大程度上减少了数据存储量.其次,分析两条轨迹上有时间交叠的MBB之间影响相似性的因素:时间持续、空间距离和盒内数据点的密度.剖析这3个因素对轨迹相似性的影响作用,提出了利用MBB压缩的移动物体时空轨迹相似性度量公式.实验证明采用本公式对移动物体时空轨迹进行聚类,可以提高聚类结果有效性指标Dunn的值. 相似文献
7.
多支持度关联规则在网络使用挖掘中的应用 总被引:6,自引:0,他引:6
关联规则方法是网络挖掘中一种备受人们关注的技术,但大多数方法在整体上采用统一的最少支持度,使得其在实际应用中受到限制。论文从这一问题出发,拟定了一个事务集,论述多支持度的关联规则方法。并把该方法应用到网络使用挖掘中,根据页面的出现频率确定其最少支持度阀值,发现并论证了不平衡数据项之间的有效规则。从执行时间和搜索空间上验证了算法的有效性。 相似文献
8.
针对现有的局部离群点检测算法对数据对象不加分区,致使计算复杂度高的问题,提出了一种基于偏离的局部离群点检测算法.该算法首先对数据集进行分区,将可能存在的局部离群点与其紧邻的簇划分到一个数据块中,然后在每个数据块内,根据离散系数刻画各个数据对象的偏离度,从而求得每个数据对象在其所属的数据块内的局部偏离因子,发现可能存在的局部离群点.理论分析和实验结果表明,该算法具有良好的识别局部离群点的能力,检测的准确率和时间效率均优于经典的LOF算法. 相似文献
9.
针对PrePost算法中需要建立复杂的前序和后序编码树(PPC-tree)和节点链表(N-list)的问题,提出一种基于间隔链表(I-list)改进的高效频繁项集挖掘算法。首先,该算法采用了比频繁模模式树(FP-tree)更加压缩的数据存储结构间隔编码的频繁模式树(IFP-tree),无需迭代地建立条件FP-tree;其次,该算法利用更简洁的I-list代替了PrePost中复杂的N-list,从而提高了建树和挖掘速度;最后,对于单分支路径的情况,该算法通过组合的方法,直接求得某些频繁项集,以提高算法的时间性能。实验结果表明:一方面,对于同一数据集在相同支持数下挖掘的结果相同,验证了改进算法的正确性;另一方面,无论在时间还是空间上改进算法的整体性能均比PrePost算法提高约10%;且对于稀疏型数据库或密集型数据库的挖掘都有较好的应用。 相似文献
10.
为了更加精确地计算道路的交通阻抗,对经典的BPR阻抗函数模型进行改进,建立长短期记忆(LSTM)神经网络预测改进函数中待定系数的正负,结合杭州市上塘高架至中河高架路段采集的交通数据进行验证. 与传统BPR阻抗函数方法、经典的EMME/2锥形延误函数计算方法、BP神经网络预测方法、LSTM神经网络预测方法得出的结果进行对比分析,结果显示在数据精度满足要求的前提下,改进的模型具有更高的准确性和可靠性. 说明使用改进模型计算得到的道路阻抗能够更为真实地反映道路的交通运行状况. 相似文献