共查询到20条相似文献,搜索用时 125 毫秒
1.
2.
3.
异常数据检测是数据挖掘研究的热点之一。本文在对现有异常点检测算法分析的基础上,提出了一种基于属性的异常点检测算法。简要地介绍了异常检测的现状,对基于属性的异常检测算法进行了详细分析,包括算法设计基础、算法描述、复杂度分析等。并通过与基于距离的异常点检测算法进行实验比较,表明了算法的优越性。 相似文献
4.
异常轨迹检测是轨迹数据挖掘研究领域的一个重要研究内容,基于演化计算的异常轨迹检测算法(Top-k evolving trajectory outlier detection, TOP-EYE)是一种有效的异常轨迹检测算法。不同于其他算法采用的轨迹距离计算方法,TOP-EYE算法
从轨迹的方向和密度角度出发,采用演化计算的方式检测异常。为了提高TOP-EYE算法对海量轨迹数据集异常检测的效率,本文在其基础上提出了基于MapReduce的异常轨迹检测并行算法(Parallel detecting abnormal trajectory based on TOP-EYE, PDAT-TOP
),利用MapReduce并行计算的优势提高了异常轨迹检测的效率。将算法PDA
T-TOP在Hadoop平台上加以实现,实验结果表明,算法PDAT-TOP能够有效地检测异常轨迹,并且具有较高的可扩展性和加速比。 相似文献
5.
6.
7.
针对传统Harris角点检测法计算速度较慢、聚簇现象较严重和在纹理信息少的区域提取角点数较少等不足,提出一种自适应Harris角点检测法,该算法利用巴特沃斯滤波器增强小波细节系数,通过计算角点响应函数的二阶值设定自适应阈值,从而提高Harris角点检测的精度和效率.实验表明,与传统的Harris角点检测法比较,该方法检测速度较快、角点的分布较均匀,且伪角点较少. 相似文献
8.
目的 基于边缘轮廓的角点检测算法的检测性能虽然相对比较稳定,但是它对边缘轮廓的局部变化敏感,并且只是给予一个经验门限去提取角点,为此提出一种对局部变化和噪声稳健的基于图像边缘轮廓自适应阈值的角点检测算法。方法 该算法利用各向异性高斯方向导数滤波器对不同边缘和角点模型进行表征,提取表征边缘和角点的灰度及几何变化的不变属性,并通过正则化计算得到区别边缘和角点的自适应阈值。该算法首先利用Canny边缘检测器检测输入图像的边缘映射并从边缘映射中提取出边缘轮廓;然后利用各向异性高斯方向导数滤波器对所提取出的边缘曲线进行滤波平滑,计算出每一像素点的响应并与自适应阈值作比较,把响应大于阈值的点作为候选角点;最后,对候选角点进行非极大值抑制得到最终角点集。结果 提出的算法分别与Harris算法,He & Yung算法,以及ANDDs算法在仿射变换和高斯噪声的实验环境下进行比较,其性能指标为平均重复率与定位误差;并且对每个角点检测算法在无噪声和有噪声的情况下进行了角点匹配比较。4种算法的两个指标的平均排名为Harris 3.375,He &Yung 2.625,ANDDs 2.625,本文算法 1.375。本文算法在仿射变换以及高斯噪声的情况下有着良好的平均重复率和定位误差,优于其他3种算法。匹配实验中的错误点以及丢失点也少于其他3种算法。结论 图像的特征检测在计算机视觉领域是一个重要的课题,在许多视觉系统中,检测特征往往作为复杂计算的第1步。因此,这一步的可靠性会极大地影响着视觉系统整体的结果。而角点作为图像的重要特征,对其研究具有重大意义。本文算法不同于传统的基于边缘的角点检测器仅利用边缘轮廓的信息,还利用到图像边缘像素的灰度信息。而且,本文算法还采用一个自适应全局阈值,避免了角点的误判。正则化的灰度变化有效减少了噪声或者光照对检测性能的影响。通过角点匹配实验、仿射变换实验以及高斯噪声实验,可以看出,本文的角点检测器拥有良好的检测性能,并且对噪声具有稳健性。 相似文献
9.
异常检测是一种流行的数据挖掘任务,但是轨迹数据的异常检测的研究比较少,而且存在的算法也较有局限性,因此J.-G Lee等人提出了TRAOD算法。该算法能够有效地检测出异常的轨迹,但是也存在着缺陷。它的复杂度和准确度比较难平衡,在参数的选取上也比较难,算法的运行时间较长。基于TRAOD的问题,提出一种基于R-tree的高效的异常轨迹检测算法R-TRAOD。该算法通过R-tree对轨迹点进行索引搜索其领域内的轨迹点,然后根据TRAOD算法对R-tree索引出来的轨迹点进行异常轨迹的检测,这样可以提高算法的运行速度。真实数据实验测试表明,该算法比最新的TRAOD异常轨迹挖掘算法效率要高。 相似文献
10.
11.
基于R-Tree的高效异常轨迹检测算法 总被引:1,自引:0,他引:1
提出了异常轨迹检测算法,通过检测轨迹的局部异常程度来判断两条轨迹是否全局匹配,进而检测异常轨迹.算法要点如下:(1) 为了有效地表示轨迹的局部特征,以k个连续轨迹点作为基本比较单元,提出一种计算两个基本比较单元间不匹配程度的距离函数,并在此基础上定义了局部匹配、全局匹配和异常轨迹的概念;(2) 针对异常轨迹检测算法普遍存在计算代价高的不足,提出了一种基于R-Tree的异常轨迹检测算法,其优势在于利用R-Tree和轨迹间的距离特征矩阵找出所有可能匹配的基本比较单元对,然后再通过计算距离确定其是否局部匹配,从而消除大量不必要的距离计算.实验结果表明,该算法不仅具有很好的效率,而且检测出来的异常轨迹也具有实际意义. 相似文献
12.
13.
AIS数据是指通过AIS系统获取的船舶运动轨迹信息, 对其进行挖掘可以获得船舶的运动模式、航行路线、停靠地点等信息. 但其在采集过程中产生的离群点会对聚类等任务造成负面影响, 因此对AIS数据挖掘之前需要进行离群点检测. 然而, 当AIS轨迹数据中存在大量离群点时, 会导致大多数离群点检测算法的准确率显著下降. 为了解决这个问题, 本文提出了一种基于中心移动的轨迹离群点检测算法(center shift outlier detection, CSOD). 通过迫使数据点向其K近邻集合的中心移动, 使每个数据点更加接近典型数据, 从而有效地消除了离群点对聚类的影响. 为了验证本文算法的有效性, 使用浙江海域AIS渔船轨迹数据集, 将本文提出的CSOD算法与一些经典的离群点检测算法进行了对比实验. 实验结果表明, CSOD算法整体上性能更加优越. 相似文献
14.
局部离群点挖掘算法研究 总被引:14,自引:0,他引:14
离群点可分为全局离群点和局部离群点.在很多情况下,局部离群点的挖掘比全局离群点的挖掘更有意义.现有的基于局部离群度的离群点挖掘算法存在检测精度依赖于用户给定的参数、计算复杂度高等局限.文中提出将对象属性分为固有属性和环境属性,用环境属性确定对象邻域、固有属性计算离群度的方法克服上述局限;并以空间数据为例,将空间属性与非空间属性分开,用空间属性确定空间邻域,用非空间属性计算空间离群度,设计了空间离群点挖掘算法.实验结果表明,所提算法具有对用户依赖性少、检测精度高、可伸缩性强和运算效率高的优点. 相似文献
15.
局部离群点检测是近年来数据挖掘领域的热点问题之一.针对交通数据去噪问题,提出一种基于局部估计密度的局部离群点检测算法,算法使用核密度估计方法计算每个数据对象的密度估计值,来表示该数据对象的局部估计密度,并在核函数的带宽函数计算中引入数据对象的k-邻域平均距离作为其邻域信息,然后利用求出的局部估计密度计算数据对象的局部离群因子,依据局部离群因子的大小来判断数据对象是否为离群点.实验表明,该算法在UCI标准数据集与模拟数据集上都可以取得较好的表现. 相似文献
16.
17.
18.
基于密度的局部离群点检测算法 总被引:1,自引:0,他引:1
基于统计学和基于距离的离群点检测都依赖与给定数据点集的全局分布,然而数据通常并非都是均匀分布的。当分析分布密度相差很大的数据时,基于密度的局部离群点检测方法有着很好的识别局部离群点的能力。但存在时间复杂度较大,文章提出了一种改进的算法,能降低时间复杂度,实现有效的局部离群点的检测。 相似文献
19.
传统的离群检测方法多数源于单个数据集或多数据源融合后的单一数据集,其检测结果忽略了多源数据之间的关联知识和单数据源中的关键信息.为了检测多源数据之间的离群关联知识,提出一种基于相关子空间的多源离群检测算法RSMOD.结合k近邻集和反向近邻集的双向影响,给出面向多源数据的对象影响空间,提高了离群对象度量的准确性;在影响空... 相似文献
20.
对医疗数据库中存在的离散数据进行检测时,由于缺少数据过滤等过程而导致检测执行时间较长、检测效率低、离散点检测率低等问题,为此提出基于层次化深度学习的医疗数据库离散数据检测算法.首先,采用动态网格划分法划分空间中的稀疏区域和稠密区域,降低数据检测的规模,缩短检测执行时间;然后,通过层次化深度学习过程融合专家知识和数据的属性取值分布信息,实现医疗数据库中离散数据的检测.实验结果表明,该算法可以在较短的时间内准确完成医疗数据库中离散数据的检测,且相较于传统算法来说更具有应用优势. 相似文献