首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
提出一种基于马氏距离的分段矢量量化时间序列分类(Mahalanobis distance-based time series classification using PVQA, MPVQA)算法。该算法在继承传统算法时间复杂度的基础上,引入马氏距离,克服了欧氏距离容易受模式特征量纲影响的缺点,提高了算法精度。首先,在训练时采用分段矢量量化近似方法获得码本,然后以马氏距离为相似性度量对时间序列进行分段重构。对重构后的时间序列,同样基于马氏距离为相似性度量进行判别。在4个时间序列数据集上进行的试验结果验证了所提方法在时间序列表示和分类上的优越性。  相似文献   

2.
时间序列重新描述和相似性度量是时间序列数据挖掘的研究基础,对提高挖掘任务的效率和准确性至关重要.提出了一种新的基于形态的时间序列子序列符号描述,并给出了相应的子序列形态距离公式,以度量时间序列子序列的相似性.该方法直观简洁,对数据的平移、伸缩不敏感,能够反映子序列趋势变化的程度、去除噪声的影响,满足时间多分辨率要求.实验结果表明了算法的有效性.  相似文献   

3.
针对时间序列的相似性度量问题,提出基于分段聚合时间弯曲距离的时间序列挖掘方法。首先运用经典分段聚合近似方法来对时间序列进行数据变换,实现时间序列的特征提取和数据降维,然后利用动态时间弯曲距离进行距离计算,最后将其应用于时间序列聚类和分类的数值实验中。新方法不仅过程简单、易于实现,而且实验结果表明其平均分类错误率与传统分段时间弯曲相比,几乎降低了50%。同时,新方法在运行时间和聚类挖掘结果上都具有一定的优势。  相似文献   

4.
将并行计算的策略引入到时间序列处理中,提出基于Map/Reduce的时间序列相似性搜索算法,充分利用云计算可进行大规模计算和数据处理的特点,有效降低了时间序列相似性搜索中运算量,简化了计算过程。该算法在心电图数据集上进行相似性搜索,分别进行PAA下界过滤和DTW距离的计算,验证运算时间和并行加速比随节点变化的情况,与传统的单机运算相比,有效地提高了时间序列挖掘效率。  相似文献   

5.
为合理分析大跨桥梁主梁的失效概率,考虑到多个控制监测点失效模式的相关性,提出了大跨桥梁主梁失效概率分析的信息融合新方法。利用极值应变信息,引入双变量PairCopula模型和R-Vine模型,结合多个控制监测点的功能函数,对监测点失效模式相关性进行最优Regular vine copula(R-Vine Copula)建模分析,融合一次二阶矩(FOSM)方法,进行失效模式相关的大跨桥梁主梁失效概率分析,通过在役桥梁监测数据对本文方法的合理性进行验证,并与其他分析方法进行比较。结果表明,考虑控制监测点失效模式相关性的大跨桥梁主梁失效概率分析的最优R-Vine Copula信息融合方法较为合理。  相似文献   

6.
时间序列的模式距离   总被引:11,自引:0,他引:11  
为了有效度量时间序列变化趋势的相似性,基于时间序列的分段线性表示,针对变化趋势,提出时间序列的模式模型表示.该模式模型表示不对测量尺度进行标准化处理,实现了模式距离的快速计算.序列模式距离克服了以点距离为基础的时间序列误匹配以及物理概念不明确等缺陷.对应于时间序列线性分段数目的不同,模式距离体现了多分辨特性,可以有效反应不同分析频率下时间序列的相似程度.  相似文献   

7.
一种时间序列相似性的快速搜索算法   总被引:5,自引:0,他引:5  
时间序列数据库中相似子序列的搜索,常用滑动窗口、分形插值逼近等方法将时间序列分割成各子序列,线性拟合各分段子序列,计算查询序列与各子序列的欧氏距离,满足距离阈值条件的为相似子序列.这些方法忽略了时间序列本身的位置和连贯特性.为此提出时间序列变化关键点的概念,以检索出的关键点为边界分割时间序列,线性拟合各分割的子序列,计算查询序列和各子序列的形态距离,快速搜索出相似子序列.  相似文献   

8.
时间序列模式挖掘的算法研究   总被引:1,自引:2,他引:1  
提出一种进行时间序列模式挖掘的算法 ,用于对大型数据库的海量数据分析 ,从中挖掘出超过用户给定支持度和置信度的时间序列 ,从而为用户的决策支持和趋势预测提供依据 .算法分为在数据中对于频繁项集的发现和频繁序列挖掘两个部分 ,排除不可能达到支持度和置信度阈值的项集 ,缩小了挖掘中的数据扫描范围 ,提高了数据挖掘的效率  相似文献   

9.
文章针对局域网通话流量监测数据,提出了一种新的基于时间序列自相关的关联规则挖掘方法。该方法通过对数据进行平滑处理、求自相关函数,从而确定信号的周期;通过动态阈值对时间序列进行压缩处理提取流量趋势序列,提出DS-MMFI算法完成序列模式的挖掘。结果表明此算法能够有效去除时间序列的波动,且序列模式挖掘结果符合实际通信特征。  相似文献   

10.
基于时间序列相似性度量的瓦斯报警信号辨识   总被引:1,自引:0,他引:1  
提出了基于时间序列相似性度量的瓦斯报警信号自动识别技术.基于动态时间弯曲(DTW)距离对从山西某高瓦斯煤矿2010年瓦斯监测数据库中提取的150组数据采集周期为9~70s的采掘工作面瓦斯含量超限报警时间序列进行聚类分析,获得了7种典型的瓦斯超限报警时间序列模式;以此为数据源,采取分段形态度量方法,提取并筛选出3个重要指标,建立了瓦斯报警时间序列形态特征库,并提出了基于分段形态度量的瓦斯报警信号快速辨识算法.对另外150组瓦斯报警时间序列进行辨识,实验表明,准确率达92%以上.尤其是通过联合分析瓦斯报警时刻前后的k0和k1值可以快速辨别瓦斯超限原因是炮后瓦斯还是突出警报,统计表明,k0〉0.1,k1〉0时,100%发生煤与瓦斯突出.  相似文献   

11.
针对多维数据属性对聚类分析结果有不同重要程度影响的问题,提出一种基于自适应属性加权的近邻传播聚类算法。该方法通过考虑多维数据属性权值的重要度,在近邻传播聚类过程中引入属性加权相似性矩阵计算,并根据当前数据聚类划分的结果来分析目标评价函数,计算各个属性对当前聚类的贡献程度。随后根据贡献程度的计算结果自适应地更新属性权值,并通过属性加权相似性矩阵来重新计算近邻传播算法中的两种竞争信息,进而提高聚类结果的质量。数值实验结果表明,新方法能够有效实现属性权值的自适应调整,提高近邻传播算法的聚类效果,与其他传统聚类算法相比新方法具有更好的聚类质量。  相似文献   

12.
将主元分析(principal component analysis, PCA)模型相似度(以下简称PCA相似度)和谱聚类(spectral clustering)算法相结合,并用于基于高炉历史数据挖掘的炉况工作点变化的分析。利用PCA相似度与距离相似度的加权来衡量滑窗数据集之间的相似度,进一步将数据集的聚类问题转化为图的最优划分问题,通过谱聚类得到聚类结果。该方法降低了高炉工作点漂移的影响,能够有效稳定的实现高炉炉况工作点的聚类。基于现场历史数据的离线测试表明:与已有的基于PCA相似度和k-means聚类的算法对比,本研究可以更加有效区分炉况工作点的跳变。  相似文献   

13.
在用户访问网站点击流形成频繁序列的基础上,提出基于距离函数的聚类分析算法.首先对数据流分区做K均值聚类生成中间聚类结果,然后对这些均值参考点进行离线聚类,以获取用户访问模式.理论分析和实验表明,算法具有较好的聚类效果.  相似文献   

14.
一种基于近似EMD的DBSCAN改进算法   总被引:2,自引:2,他引:0  
DBSCAN(density based spatial clustering of applications with noise)算法是基于密度的经典聚类算法,但是该算法应用于高维数据时,常用距离函数不能很好地反映出数据点之间的关系, 从而可能导致聚类簇不够精确。如果能在高维空间中采用合适的距离度量,将会改善聚类结果。针对上述问题,提出利用近似EMD(earth mover’s distance,堆土机距离)作为距离测度,通过迭代搜索的方法找出所有直接密度可达对象实现聚类。实验结果表明:在高维文本数据的聚类中,和原来算法相比,改进算法的正确率提高了6%,两者在时间上相差不大;而对低维的Iris数据,改进算法通过EMD改善了实体间的相似性度量,减少了划分为噪声点的数据点个数,平均正确率提高了10%。实验结果表明了改进算法对高维数据的有效性,并可以改善聚类性能。  相似文献   

15.
为实现已有设计实例的重用,满足对设计基元层次相似搜索的要求,提出了一种三维模型检索方法.在模型B-Rep数据结构基础上,通过构造离散曲面获取三维模型的离散点集.利用正态分布种子作为索引,对离散点集进行随机选取,计算任意两点之间的欧氏距离获得三维模型的欧氏距离序列.通过分治快速排序和概率分布统计获得三维模型的形态分布图,将其作为三维模型的检索索引,并进行了鲁棒性分析.使用BP神经网络对不同模型的形态分布图进行非线性映射,通过比较三维模型的形态分布图获得其形状相似度,实现了设计基元的检索.开发了原型系统,以机械零件的不同粒度设计基元为重点进行验证和应用,实验结果表明,该方法具有较好的可计算性和较高的检测精度,对于实现已有设计重用及提高产品设计效率具有重要意义.  相似文献   

16.
采用经典的欧几里德距离、曼哈顿距离以及形状相似距离3种不同相似度度量方式,应用标准模糊C均值聚类算法在多个表示矩形对象的二维随机数据集上进行聚类,分析对比其相似度评估性能。聚类结果的分类统计表明,形状相似距离相比其他两种距离,能够考虑矩形对象的形状相似因素进行相似度评估。  相似文献   

17.
利用核主元分析非线性性能监控的优势,并将相似度分析引入故障诊断领域,提出了基于核主元分析和模式匹配技术相结合的性能监控和故障诊断方法。针对PCA相似度分析存在的问题,对该方法进行了改进。由于KPCA方法具有较好的非线性特性提取能力,因此首先利用KPCA法计算数据的非线性主元,然后计算不同数据集之间的非线性主元相似度;并将主元相似度、非线性主元相似度和基于距离的相似度赋予不同的权值构成综合相似度指标来进行模式匹配。TE过程仿真试验验证了该方法在非线性性能监控与故障诊断中的有效性。  相似文献   

18.
为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少K-means的欧氏距离计算次数.该算法基于Spark平台实现并行计算,进一步地提高了算法的运行效率.SPGK不但能够获得良好的聚类效果,而且缩减了欧氏距离计算次数,适用于海量数据的快速聚类.在千万级数据集上的实验结果表明,SPGK的性能明显优于现有的K-means++和基于K均值聚类的递归划分方法.  相似文献   

19.
采用全球定位系统技术对宜(昌)—巴(东)高速公路大山坡隧道及高边坡进行监测.对大山坡隧道进行监测时,根据隧道特点等间距布置监测断面,选择隧道出口右侧监测断面,将监测点置于监测断面拱顶,安装位移计测定位移;对高边坡进行监测时,根据滑动范围选定测线和监测点,将3个监测点相应地布置在边坡体上,并布设变形监测基准网,实时获取隧道及高边坡各监测点的三维基准坐标.将处理分析所得的监测结果与数值模拟分析预测结果进行比较,其中隧道实际监测拱顶沉降为24.3 mm,数值模拟分析结果为22.5 mm,两者符合度很好,在监测预警系统中的评价等级为稳定.基于全球定位系统技术的山区公路隧道及高边坡监测技术具有选点灵活、自动化高、可全天候监测、定位精度高、监测数据可靠等优点.  相似文献   

20.
桥梁健康监测系统利用通信传感设备远程记录运营中的结构持续响应,通过对信号数据的处理分析实现桥梁结构的实时预警与安全评估,从而达到保护结构正常运营、延长结构使用寿命、指导桥梁结构管养与维护决策的目的。桥梁健康监测技术作为桥梁工程领域新兴的分支,已逐渐成为一个热门研究方向。为了促进该领域研究进一步发展,指导健康监测系统在桥梁工程中更高效地应用,对桥梁健康监测系统的实施决策、传感器信号预处理、信号数据降噪处理、模态参数识别、有限元模型修正、损伤识别、状态预测与评估等关键技术方法的研究现状进行了详细介绍,并对2019年度内相关研究进展及应用进行了总结与评述,最终发现模式识别技术与机器学习方法正越来越广泛地应用到桥梁健康监测的研究中。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号