共查询到20条相似文献,搜索用时 77 毫秒
1.
2.
基于网格的数据分析方法以网格为单位处理数据,避免了数据对象点对点的计算,极大提高了数据分析的效率。但是,传统基于网格的方法在数据分析过程中独立处理网格,忽略了网格之间的耦合关系,影响了分析的精确度。在应用网格检测数据流异常的过程中不再独立处理网格,而是考虑了网格之间的耦合关系,提出了一种基于网格耦合的数据流异常检测算法GCStream-OD。该算法通过网格耦合精确地表达了数据流对象之间的相关性,并通过剪枝策略提高算法的效率。在5个真实数据集上的实验结果表明,GCStream-OD算法具有较高的异常检测质量和效率。 相似文献
3.
离群点检测问题作为数据挖掘的一个重要任务,在众多领域中得到了应用.近年来,基于数据流数据的挖掘算法研究受到越来越多的重视.为了解决数据流数据中的离群点检测问题,提出了一种基于数据空间动态网格划分的快速数据流离群点检测算法.算法利用动态网格对空间中的稠密和稀疏区域进行划分,过滤处于稠密区域的大量主体数据,有效地减少了算法所需考察的数据对象的规模.而对于稀疏区域中的候选离群点,采用近似方法计算其离群度,具有高离群度的数据作为离群点输出.在保证一定精确度的条件下,算法的运行效率可以得到大幅度提高.对模拟数据集和真实数据集的实验检测均验证了该算法具有良好的适用性和有效性. 相似文献
4.
在无线传感器网络下,进行分布式系统下数据流时间序列的离群检测研究,对实际生活中的火灾检测、欺诈、入侵检测和金融分析等诸多领域都有非常重要的作用。本文先对序列进行标准化,再利用动态时间弯曲距离进行序列间离群检测,较大地提高了检测的精度。同时针对DTW的计算复杂度瓶颈问题,加入了提前终止的思想,并利用多级判断来进一步提速。通过NS2仿真实验,验证了本文所提出的分布式系统下离群序列的加速检测方法既节省了能量消耗,又保持了较高的检测准确率和速度。 相似文献
5.
现有的索引结构难以有效地支持DTW距离度量下的多元时间序列相似性搜索.首先给出一种将不等长多元时间序列转换为等长一元时间序列的方法,并证明这种转换满足下界距离引理;以此为基础,提出一种多元时间序列的DTW下界距离,并对其性质进行分析;然后,针对给出的下界距离,提出一种支持DTW距离度量的多元时间序列索引结构,对多元时间序列数据库进行有效组织;再给出多元时间序列相似模式搜索算法及流程,并证明该搜索方法具有非漏报性;最后,通过实验对所提方法的有效性进行验证. 相似文献
6.
7.
为实现对网络数据流中异常的完全检测,提高网络数据流的安全性与可靠性,引进数学模型,从硬件与软件两个方面,设计一种针对网络数据流的异常检测系统。首先,选择HTLMK-15000型号的采集设备与F1501-G1400型号的单片机作为系统的主要硬件。其次,在硬件设备的支撑下,获取网络数据流的异常特征与属性,引进分段线性值函数(Piecewise Linear Value Function,PLVF)数学模型,对采样中的局部异常点进行强化训练,并通过对网络数据流尺度的分解,实现对数据流异常的识别与检测。最后,选择基于改进单类支持向量机(One Class Support Vector Machine,OCSVM)技术的异常检测系统作为传统系统,开展对比实验。实验结果表明,设计的系统在实际应用中可以实现对样本中全部异常点的精准检测,检测结果更加全面。 相似文献
8.
9.
10.
本文对互联网络的拥塞及其控制问题进行了深入探讨分析。首先分析了造成网络拥塞现象的深层次原因及恶意数据流对拥塞的影响,进而阐述了基于数据流的网络异常检测对控制网络拥塞的作用,并给出了进行网络异常检测的三个基本步骤。 相似文献
11.
本文对基于分布式的演化数据流的连续异常检测问题进行了形式化描述,提出一种在滑动窗口中基于张量分解的异常检测算法--WSTA.该算法将各分布结点上的数据流作为全局数据流的子张量,通过分布结点与中心节点的通信,在分布结点的滑动窗口中自适应抽样生成概要数据结构矩阵.对该数据矩阵进行张量分解得到特征向量,然后采用基于距离的异常检测方法发现异常点.基于大量真实数据集的实验表明,此算法具有良好的适用性和可扩展性. 相似文献
12.
基于分段时间弯曲距离的时间序列挖掘 总被引:22,自引:1,他引:22
在时间序列库中的数据挖掘是个重要的课题,为了在挖掘的过程中比较序列的相似性,大量的研究都采用了欧氏距离度量或者其变形,但是欧氏距离及其变形对序列在时间轴上的偏移非常敏感.因此,采用了更鲁棒的动态时间弯曲距离,允许序列在时间轴上的弯曲,并且提出了一种新的序列分段方法,在此基础上定义了特征点分段时间弯曲距离.与经典时间弯曲距离相比,大大提高了效率,而且保证了近似的准确性. 相似文献
13.
基于多维数据流挖掘技术的入侵检测模型与算法 总被引:5,自引:0,他引:5
网络访问数据有着数据流的高速、无穷达到的特点,所以利用传统多遍扫描数据库的挖掘技术来构建入侵检测模型是不可行的.针对网络访问数据流的特点,提出了一种基于多维数据流挖掘技术的入侵检测模型.此模型将传统的误用检测和异常检测两种入侵检测方法进行有机融合,因此能够克服目前广泛使用的误用检测方法无法检测新的攻击类型的缺点,并且也能够保持检测的高效性.网络访问数据记录的结构是复杂的,一个访问行为总是联系到许多属性,所以分析的难度很大.因此,引入多维频度等概念来解决网络数据流的模式表示和生成问题.同时,针对多维频度模式的特点,提出了一种新型数据结构MaxFP-Tree.在MaxFP-Tree的基础上,给出了一种高效的挖掘网络访问数据流的学习算法MaxFPinNDS.MaxFPinNDS采用衰减机制挖掘,可以快速地形成一个数据流的最近时期数据所隐舍的最大频繁项目集.实验表明,设计的入侵检测模型是有效的. 相似文献
14.
数据流中异常模式的提取与趋势监测 总被引:11,自引:0,他引:11
研究的重点是数据流环境中异常模式的提取与趋势监测.主要贡献包括:①提出了一个进行异常模式发现的度量框架——强度比率,为异常模式挖掘提供了度量标准;②在基于异常模式求取的基础上,提出了利用回归分析方法——最小二乘法进行异常模式趋势监测.实验结果表明,提出的异常模式度量和求取算法是合理的,提出的趋势监测方法是有效的、可行的. 相似文献
15.
Outlier detection is a very useful technique in many applications, where data is generally uncertain and could be described using probability. While having been studied intensively in the field of deterministic data, outlier detection is still novel in the emerging uncertain data field. In this paper, we study the semantic of outlier detection on probabilistic data stream and present a new definition of distance-based outlier over sliding window. We then show the problem of detecting an outlier over a set o... 相似文献
16.
17.
动态时间弯曲算法(DTW)是一种常见的时间序列相似性度量方法,对数据挖掘任务起着至关重要的作用。针对现有DTW算法的时间复杂度高、度量精确度一般的特征,提出一种DTW下界函数的提前终止算法(LB_ESDTW)。引入提前终止思想,提高算法的执行效率;再在提前终止算法思想的基础上,与DTW下界函数相结合,提出一种基于提前终止DTW的下界函数算法(LB_ESDTW)。该算法在保证高效的运行时间效率的同时,也使得算法的度量准确率得到了提升。实验结果表明,LB_ESDTW在绝大部分时间序列数据集中,都表现出良好的适应性,针对不同类别的时间序列,都能有良好的度量性能。 相似文献
18.
在全球社会老龄化的大背景下,老年人的身体健康状况和晚年生活质量需要更多的关注。跌倒在老年人群中发生率高并且带来的后果比较严重。文中提出一种应用于家庭场景的基于Inner-Distance形状上下文( Inner-Distance Shape Context,IDSC)的跌倒检测方法。该方法通过Inner-Distance形状上下文获得视频帧前景形状的描述信息,使用形状匹配方法对视频序列中人体形状变化进行量化。对形变量化信息使用动态时间规整( Dynamic Time Warping,DTW)方法实现跌倒行为的判定。实验结果表明该方法可有效、快速地判断跌倒,提取结果具有较好的查准率和查全率。 相似文献
19.